在 Somake 上體驗雲端級渲染速度,輕鬆創作出真實、連貫的影片畫面。
尚未有相關紀錄
Kling O1(Omni-1)帶來了生成式媒體的新風潮,是業界首款「推理型」影片模型。不同於傳統只靠樣式比對來生成畫面的擴散模型,Kling O1 採用統一的 Transformer 架構,在渲染前能夠真正「理解」場景的物理規律與空間邏輯。
這項架構突破,讓它能在單一神經網路內,同時處理文字轉影片、圖片轉影片,以及多種複雜影片編輯,產出在物理上貼近真實世界、連貫性前所未有的內容。
仿照先進大型語言模型的推理能力,Kling O1 會在生成前計算出如流體動態、光線反射、布料模擬等物理互動,這大幅減少了「幻覺」情況(像是手部變形),也能確保複雜動作中的時間一致性。
模型帶來「聲明式編輯」的新方式。不用繁瑣地做遮罩或套索,使用者只要直接輸入「換成燕尾服」或「讓背景變成下雨的賽博龐克城市」這類指令,模型就能理解影片的語意結構,只修改指定元素,並保留原有動作。
Kling O1 拓展了主體的「注意力鎖」機制。透過分析參考圖片,模型建立角色外型的 3D 一致性表現,讓人物在不同場景、角度、光線下都能被認出,是劇情敘事不可或缺的重要功能。
為了精準掌控多模態輸入,Kling O1 支援符號語法來管理素材。你只需在提示欄輸入 @,就能直接引用你上傳的圖片、特定視覺元素或影片片段,指令將與指定素材直接綁定,渲染過程中模型會嚴格按照這些主題或動作參考來生成。
範例:讓@image1 的角色微微轉頭並眨眼,並將 @image2 的水彩質感和柔和擴散光效果應用在動畫上,確保主體與背景的銜接自然流暢。
這兩款模型都是 2025 年生成式 AI 領域的佼佼者,但用途截然不同。
Kling O1 是 創作者引擎,能細緻掌控畫面動作與物理。得益於統一架構,特別適合需要修改畫面局部或要求角色執行特定動作的複雜流程,是劇情片和視覺特效的首選。
Veo 3.1(Google) 則被定位為 廣播級引擎,擅長輕鬆生成高質感、類似「素材影片」的內容,適合快速大量生產。
自然語言提示和視覺參考能無縫融合,引導生成過程。目前 Somake 上的整合重點在 圖片轉影片 工作流。你可以將文本和上傳的靜態圖片(像是 @image1 之類的變數)結合使用,指定角色一致性、結構或風格。注意:目前尚未支援將影片作為輸入素材。
Somake 免去多方訂閱的困擾,讓你一鍵存取 Kling O1、Veo 等頂尖模型,全部集中在同一個簡潔控制台操作。
我們運用企業級雲端 GPU,輕鬆應對 Kling O1 強大的運算需求,讓你不必依賴昂貴本地設備,也能高速產出高品質影片。
Somake 把 Kling O1 的複雜參數包裝在直覺的 UI 裡,還有智慧提示助手協助優化輸入結構,輕鬆產出最佳影片成果。
有的,O1 最新架構已設計能自動同步產生和畫面內容相符的音效,包括環境音與特效聲。
Kling O1 大幅提升在影片內輸出清晰可讀文字(如標誌、螢幕、標籤等)的能力,有效減少舊型 AI 產生亂碼「AI 字」的狀況。
是的。你擁有所生成影片的完整商業權,能安心運用於廣告、社群或電影等專案。
可以。Kling O1 支援相機運鏡參數(如平移、傾斜、縮放、滾動等),你可以像導演一樣精確控制「鏡頭」動作。