IT之家 9 月 6 日消息,繼 ChatGPT 掀起“吉卜力、像素風”AI 生圖熱潮后,近期海外出現(xiàn)利用 Gemini 2.5 Flash Image(代號 Nano Banana)AI 模型“照片模型手辦化”玩法。
IT之家注意到,目前谷歌 Gemini 已正式上線相應模型,用戶在首頁即可看到帶有香蕉 Emoji 的“ 用 Imagen 生成圖像”按鈕,點擊按鈕后即可通過提示詞生成圖像,無需專門訪問 Google AI Studio 生圖。
以“照片手辦化”為例,用戶可以輸入如下提示詞,并上傳照片進行 AI 生圖:
Please turn this photo into a figure. Behind it, there should be a paper box which has partially transparent plastic window, with the character from this photo printed on the box. In front of the box, on a round plastic base, place the figure version of the photo I gave you. I’d like the PVC material to be clearly represented. It would be even better if the background is indoors.
IT之家獲悉,Gemini2.5 Flash Image 于今年 8 月 26 日發(fā)布,是目前谷歌最先進的圖像生成與編輯模型,企業(yè)用戶可通過 Vertex AI 獲取。Gemini 2.5 Flash Image 的定價為每 100 萬輸出 token 30.00 美元。單張圖像為 1290 個輸出 token(即每張圖像約 0.039 美元,IT之家注:現(xiàn)匯率約合 0.28 元人民幣)。所有其他輸入和輸出模態(tài)的計價均遵循 Gemini 2.5 Flash 的定價標準。