AI 文章

Gemini 2.0 圖片生成功能實測:免費AI P圖神器來了?用嘴就能修圖、生成圖片!

最近 Google 的 Gemini 2.0,開放了之前發布時所宣稱的原生生成圖片功能,讓我們可以使用 Gemini 來生成圖片,甚至是輸入自己的圖片來讓 Gemini 改圖,堪稱是 P 圖神器。不管是用作移除路人、改髮色、商品照片合成,效果都相當的不錯,今天就來簡單的測試給大家看看。

The Walking Fish 步行魚 頭像

· 1812 字 / 閱讀時間: 5 分鐘 · 載入中... ...

文章 Gemini 2.0 圖片生成功能實測:免費AI P圖神器來了?用嘴就能修圖、生成圖片! 的特色圖片

在 Gemini 2.0 剛推出時,Google 有表示 Gemini 2.0 將支援原生的圖片輸出功能,而現在 ── 他來了!在上上個禮拜,這項功能已經在 Google AI Studio 中免費推出了!

現在我們不只可以直接叫 Gemini 生成圖片,甚至還能丟圖片給它,用講的就能修改圖片內容,根本就是 P 圖神器啊!在 X (前Twitter) 上也已經可以看到許多人使用它,做出各種有趣的圖片。

今天就帶大家來簡單試用一下,看看 Gemini 2.0 的圖片生成效果到底怎麼樣?可以應用在哪些地方?

使用 Gemini P 圖修改髮色

如何開始使用 Gemini 圖片生成?

想玩玩看 Gemini 的圖片生成功能,步驟很簡單:

  1. 前往 Google AI Studio
  1. 在模型選擇的地方,找到並選擇 Gemini 2.0 Flash (Image Generation) Experimental 這個模型。

  2. 選好之後,就可以開始玩圖片生成啦!

直接生成圖片效果測試

接下來我們就可以來試試,Gemini 的圖片生成效果,以下放一些生成範例給大家看看(左邊統一放 Gemini 2.0 生成的圖片)。

1
Astronaut in a jungle, cold color palette, muted colors, detailed, 8k

Gemini 2.0 Flux.1 dev


1
Pirate ship trapped in a cosmic maelstrom nebula, rendered in cosmic beach whirlpool engine, volumetric lighting, spectacular, ambient lights, light pollution, cinematic atmosphere, art nouveau style, illustration art artwork by SenseiJaye, intricate detail.

Gemini 2.0 Flux.1 dev


1
old man with glasses portrait, photo, 50mm, f1.4, natural light, Pathéchrome

Gemini 2.0 Flux.1 dev

個人感覺,某些提示詞生成出來的圖還算不錯,但整體來看與 Flux.1 dev 相比,表現遜色不少。

當然,除了用這種比較專業、雕琢過的生圖提示詞,我們也可以很隨興地用白話文、自然語言,直接跟 Gemini 說我們想要什麼樣的圖片,它也一樣能生成。

直接使用自然語言對話生成的效果,提示詞:生成一個老人的日式個人肖像照,寫實風格,使用單眼拍攝,站在大街上,背景模糊

而且,我們還可以透過持續對話的方式,請 Gemini 修改剛剛生成的圖片。如果對結果不滿意,只要點擊 Gemini 回覆右上角的 Rerun 按鈕,它就會重新生成一次。

用嘴 P 圖!圖片修改功能實測

Gemini 除了能一般的生成圖片外,更厲害的是可以輸入我們自己的圖片,然後使用對話修改!拿它當作 PS 使用,堪稱是 P 圖神器!

1. 風景照 P 圖

像這張之前去日本玩的照片,天氣陰陰的,我可以直接把照片貼給 Gemini,跟它說:「幫我把天空變得更晴朗、更藍一點!」

原始風景照 要求 Gemini 修改天空後的照片對比

2. 移除路人甲

照片裡有不想要的背景路人,一樣可以丟給 Gemini 叫它幫忙移除掉!

3. 人像 P 圖

進行一些人像處理 Gemini 也做的到!像是:

  • 改髮色、髮型:「將這位女性的頭髮變成棕色」、「將他的頭髮變成齊肩短髮」。
  • 換衣服、改姿勢:也可以調整衣著或姿勢。

修改頭髮顏色 讓頭髮變短

調整衣著與姿勢

進階玩法:多圖輸入與應用

Gemini 的圖片修改能力還不只這些!它也支援輸入多張圖片進行處理,因此讓我們可以有更多特別的玩法:

1. 商品 Mockup && 模特兒試穿

我們可以丟給 Gemini產品圖 + Logo 圖,或是模特兒照片 + 商品照片,讓它快速合成出商品的 Mockup 情境圖或是模特兒的試穿照,省下不少攝影和後製時間成本。

產品圖+Logo圖 合成 Mockup 的範例 模特兒+商品 合成試穿照的範例

2. 室內設計預覽

或是上傳多張傢俱的圖片,讓 Gemini 模擬看看家具擺放在一起的效果。

家具圖片合成擺放預覽的範例

3. 風格轉換

輸入自己的照片,要求 Gemini 將照片轉換成不同的藝術風格也是可以的,但有些風格的提示詞較不容易成功。

圖片中加字效果測試

Gemini 不只能處理圖像,它在生成文字方面也挺不錯的。我們甚至可以讓它在圖片裡面加上文字

不論是直接生成帶有文字的圖片,或是輸入一張圖片,請它在特定位置加上文字都可以。

目前經過我的測試,發現英文的生成基本上不太會有問題,而中文字的部分,竟然也能生成! 雖然效果相對不穩定,有時候會失敗或怪怪的,需要多試幾次。而且筆畫太複雜的字,基本上就生成不太出來。但跟以前比,這已經是很大的進步了!

生成帶有文字的圖片 在上傳的圖片中的特定位置添加文字 Gemini 生成中文字圖片Demo

圖文並茂:生成繪本故事

前面的測試有些人應該有注意到,Gemini 的輸出是可以 混合文字和圖片 的。利用這個特性,我們可以讓它直接生成圖文並茂的繪本故事,或是簡單的教學文章等。

結語與小牢騷

OK,以上就是今天針對 Gemini 2.0 圖片生成功能的簡單測試和介紹啦!

我知道這篇介紹出的有點晚了,主要是因為兩個禮拜前 Gemini 剛更新時,我剛好被排到留守,沒空第一時間拍片測試 (汗)。

而且最近 OpenAI 也推出了 GPT-4o 的原生圖片生成,效果完虐 Gemini,說他海放10條街都不為過。不過免費版帳號每日只能生成 3 張圖,相比之下 Google 算是相當佛心了,Gemini 2.0 Flash (Image Generation) 一天最多可以免費生成 1500 張! 對於一般的應用來說,這個能力和額度應該夠用了。

好啦,希望今天的測試對大家有幫助!

各位觀眾,我們下篇文章見!掰掰~

影片介紹