快來了解 Google 最新的 AI 圖片生成模型 Nano Banana 2 (Gemini 3 pro)。
尚未有相關紀錄
產生失敗
Nano Banana Pro 是 Gemini 3 Pro Image 架構的商業名稱。這個模型於 2025 年底正式推出,代表從傳統的隨機圖片生成邁向「推理式」的視覺合成新時代。
它結合了畫像前的認知規劃階段,突破過去在空間邏輯和文字排版上的限制。專為需要高解析度、精準遵照複雜指令、並能在圖片中完美融合文字的企業級任務打造。
原生文字排版引擎: 不需事後校正,就能在多種語言下準確對齊、無錯誤地呈現文字。
認知規劃: 啟動「思考模式」,在產生圖片前先檢查版面邏輯和事實正確性。
深度參考融合: 最多可結合 14 張不同圖片作為參考(Somake 預設:3 張,可向客服申請擴充),精細掌控風格及構圖。
專業級輸出: 圖檔原生支援 2K 與 4K 解析度,適用於印刷與數位媒體。
情境知識基礎: 利用廣泛的世界知識,創建具真實感的圖表與技術示意圖。
Nano Banana Pro 不像舊型模型只把文字當作雜訊,而是能真正理解字型和語法。它能正確渲染長段落、複雜標題,甚至各種非拉丁文字,是製作在地化行銷素材與數據豐富海報的首選。
強大的參考系統可追蹤同一角色在多張圖片中的身分。最多能分析 14 張參考圖,維持至多 5 位角色的臉部特徵與統一風格,非常適合故事分鏡和吉祥物創作。
範例提示:「這個角色的 360 度轉身圖,角色站在白色背景前。」
「思考」階段能讓模型更有理由地安排空間關係,而不是憑感覺。這讓資訊圖表更合理,人體比例正確,技術圖上的標籤放置精準。
範例提示:「做一張解釋耳機怎麼運作的資訊圖。」
針對專業工作流程設計,可精細設定鏡頭角度(如 35mm 鏡頭感)、燈光配置(如邊緣光、柔和主燈)、色彩分級,也支援局部範圍編修與填補,並保留原圖的語境。
功能 | Nano Banana | Nano Banana Pro |
架構 | 快速推論流程(提示 → 圖片)。 | 推理流程(提示 → 規劃 → 圖片)。 |
適用類型 | 靈感激發、分鏡、社群貼文草稿。 | 最終成品、複雜排版、文字設計。 |
速度 | 優化高速度與大量迭代。 | 因認知處理步驟,時間較久。 |
文字品質 | 僅基本短字,易出錯。 | 高保真度,能處理段落及多語文字。 |
參考圖片 | 參考輸入有限。 | 支援最多 14 張參考圖。 |
要發揮模型的推理能力,提示內容須具體結構化,不只是模糊描述。
推薦結構:
核心目標: 明確說明素材類型(如「技術示意圖」)。
視覺規格: 定義鏡頭、燈光和構圖(如「等角視圖,平光」)。
文字規格: 明列文字內容與字型(如「文字:SALE,用粗體無襯線字」)。
條件限制: 標明需規避或遵守事項(如「維持品牌色 #FF5733」)。
完整範本:
[素材類型] 的 [主題]。[構圖細節]。[燈光/風格]。[文字內容]:「[精確字串]」(字型:[樣式])。
風格錨定(少數示例)
描述多種風格並指定其中一種,強制套用所需美學。
提示邏輯:「參考風格:A)油畫,B)向量藝術。請將 B 風格套用在以下資料視覺化...」
反覆編修
用模型針對原有輸出進行「差異」指令微調。
提示邏輯:「輸入:[圖片]。動作:將背景改為『雨夜』。限制:不可更動角色的光線或膚色。」
數據驅動視覺化
提供原始數據及明確標籤指示,確保圖表準確。
提示邏輯:「生成柱狀圖。X 軸標籤:Q1, Q2, Q3。 Y 軸:Revenue。數據趨勢:升高。風格:企業極簡。」
打造「主打商品」情境照,將產品置於理想環境中。能直接在包裝或背景招牌上渲染指定的品項名稱或促銷標語,而且清晰易讀。
跨行銷管道保持視覺一致性。利用參考融合技術,讓吉祥物或代言人在每一張社群貼文或橫幅廣告出現的形象都一模一樣。
製作複雜、有標註的教科書或操作手冊示意圖。模型能理解「標籤」用途,正確將箭頭與文字說明放在機械或生物結構的指定部位。
自動修復歷史檔案。能按照當代色彩調性修補破損及為黑白照片上色,細節銳化同時保留原有人物特徵。
上傳粗略 CAD 草稿作參考,要求渲染寫實材質及特定燈光變化,方便進行客戶審閱。
用同一個基礎提示製作海報,再依序將文字區換成不同語言(如西班牙語、日文),原本的版型也能維持。
用參考圖定義角色,產生三格漫畫,角色分別跑步、吃飯、睡覺,臉部特徵始終如一。
文字溢出: 如果文字超出邊界,請指定「安全區域」或縮小字型(如:「文字需在中央 50% 以內」)。
身分漂移: 角色外觀不一時,請補充更細緻外型描述(如:「左臉有痣、五官完全一致」)。
虛構數據: 若圖表數據錯誤,請確認提示明確列出每個標籤,勿要求模型「自行編造資料」,務必提供真實數據。
風格串流錯誤: 風格不一致可用負向提示排除不想要的美術(如:「不要卡通元素、不允許 3D 渲染風格」)。
我們讓 API 設定超簡單,登入後選模型就能直接開始創作。
提供專屬的基礎設施,避開公用免費層常見的塞車與延遲。
無需擔心每日額度,Somake 讓高強度創作者盡情反覆產生,不怕用量被卡住。
不是。兩者完全相同。「Nano Banana Pro」只是消費端行銷名稱,核心就是 Gemini 3 Pro Image 架構。
為維持運算速度與系統穩定,目前 Somake 每次最多 支援 3 張參考圖。
想用滿 14 張? 企業客戶可來信申請擴充,請聯絡 [email protected]。
當然可以。這個模型針對全球各種文字做最佳化,包含符號及非拉丁字母都能高精度處理。
可以。模型支援「指令式編修」,能描述要怎麼改變(如「移除車子」)並上傳圖片給它編輯。