Wan 2.6 將文字與圖片化為生動影片,支援對嘴、多角色對話,還能打造專屬人物。
尚未有相關紀錄
產生失敗
Wan 是阿里巴巴集團通義實驗室開發的開源 AI 影片生成模型系列。Wan 家族代表了阿里巴巴在多模態 AI 領域的旗艦技術,能將文字提示、圖片甚至參考影片轉換為高品質、動作自然且視覺一致的影片內容。
目前版本:Wan 2.6(2025 年 12 月)
最後更新日期:2025 年 12 月
Wan 2.6 在 2.5 版推出不久後就登場,重點加強多模態整合及創作自由度。這個版本改善了之前的關鍵問題,也新增了能應對更複雜內容製作的功能。
原生音訊生成升級:音質大幅提升,聽起來更自然,但在語音逼真度方面仍略遜於 Veo 3 和 Sora 2 這類高階模型
影片長度延長:支援最長 15 秒 1080P 片段,還能串接多個片段打造長片
人物參考系統:可上傳最多三個角色參考影片,確保多次生成時人物一致 (注意:此功能尚未於 Somake 平台開放)
個人化頭像製作:可錄製自己臉部多角度畫面及語音,建立專屬 AI 人物 (注意:此功能尚未於 Somake 平台開放)
多角色對話:多角色間對話處理乾淨,不會語音重疊
場景與服裝控制:可透過提示詞自由換角色服裝與場景環境
流暢運鏡:影片生成時呈現逼真的鏡頭效果,如縮放、模糊及順暢運動
角色外貌與語音匹配有時不夠穩定——生成的臉或聲音偶爾會和參考素材有落差
多角色動作場景(像打鬥畫面)容易出現畫面異常或扭曲
動畫風格的影片生成品質比寫實風格弱
偶爾會遇到部分功能不一致,例如生成內容的語言出現錯誤
有機會產生意外元素或超現實風格,這是目前文字生成影片 AI 的常見挑戰
版本 | 核心功能 | 最長片段 | 最高畫質 | 音訊支援 |
|---|---|---|---|---|
Wan 2.1 | 文字轉影片、圖片轉影片、視覺文字生成 | 5 秒 | 720P | 不支援 |
Wan 2.2 | 效率提升、VACE 整合、開源 | 5 秒 | 720P | 不支援 |
Wan 2.5 | 影音同步、動作強化 | 10 秒 | 1080P | 基本 |
Wan 2.6 | 多鏡頭敘事、角色參考、個人化人物 | 15 秒 | 1080P | 原生影音大幅升級 |
快速社群廣告:想要 IG 上吸睛的 10 秒短片?只要輸入「我們新款球鞋動態鏡頭,水花飛濺,電影感,活力十足」,幾分鐘內就能生成專業廣告。
產品情境視覺化:不論你想像什麼場景,都能把產品影片做出來。例如:「我們最新咖啡杯放在溫馨雨天的巴黎咖啡廳書桌上,杯口冒著熱氣。」
歷史情境影片:老師可以生成「羅馬士兵穿越森林,低角度視角」的片段,讓課堂更生動好懂。
科學概念解釋:學生可自製影片解釋複雜主題,例如:「動畫帶領瀏覽植物細胞內部,展示粒線體運作過程。」
快速劇本預覽:想先視覺化劇本的分鏡,測試氛圍與構圖是否適合,大幅節省時間與預算。
獨特視覺特效(VFX):能產生超現實、夢境感的片段或抽象背景,這些在現實拍攝很難或根本做不到。
多鏡頭故事範本
電影感的 [類型] 場景。
鏡頭 1:[遠景/中景/近景],描述畫面、角色、動作。
鏡頭 2:相機角度、描述轉場及新焦點。
鏡頭 3:相機角度、描述解決或結尾畫面。
風格:[寫實/電影感/特效]。光線:[自然/戲劇/柔和]。
角色參考最佳做法
角色參考請使用正面清晰、光線充足的素材
製作個人化頭像建議錄製多角度參考影片
最多只建議提供 3 個角色參考,一致性最佳
若要匹配語音,請提供無背景雜音的清晰語音樣本
臉部和聲音可能有些微差異,多次生成時請預先規劃
表現佳:對話場景、訪談分鏡、單角色聚焦、簡單互動、多角色閒聊
需留意:多角色動作、打鬥、激烈移動分鏡
建議避免或可能有異常:複雜動畫風格、高動態群體場景
當你的提示很簡單或想要更豐富細節時,可以啟用提示詞延伸。系統將自動補充描述、細節與風格,讓畫面更協調且一致。
問題:語音聽起來機械或不自然 → 解決方式:Wan 2.6 目前技術限制。需要高逼真語音的項目,建議影片生成後,另行錄製或合成音訊。
問題:生成內容出現奇怪角色或超現實元素 → 解決方式:目前 AI 文字轉影片容易有雜訊。建議簡化提示詞、減少角色數量,重新生成並仔細挑選成果。
問題:動作場景畫面扭曲 → 解決方式:多角色動作複雜確實是弱項,建議把分鏡切成簡單的片段,每段聚焦一到兩個角色,避免安排打鬥場景。
問題:動畫風格效果差 → 解決方式:Wan 2.6 動漫生成特別弱,建議需要動畫內容可考慮其他模型,或改用寫實提示詞。
問題:內容語言不符 → 解決方式:偶爾會有語言錯誤,請在提示詞明確指定語言,再遇到落差時重新產生即可。
介面簡單直覺,人人都能輕鬆製作專業視覺,只要輸入描述就能秒生影片。
圖片與影片生成全部在同一平台完成,從構想到成品一站搞定,流程超順暢。
付費訂閱者可以將生成作品完全用於商業,包括廣告、企劃或客戶交付,超簡單又方便。
完全不需要!這就是我們平台最大優勢。所有繁瑣運算都由雲端伺服器處理,你只需要一台能上網的裝置與瀏覽器即可。
當然沒問題!在我們平台上生成的影片你都能自由利用。無論用於行銷、YouTube 等營利頻道或其他商業用途都非常適合。
Wan 2.6 是阿里巴巴開發的開源 AI 影片生成模型,能將文字、圖片、參考影片轉換為影音。具備多鏡頭故事、原生影音同步與角色一致工具,最多支援 15 秒、1080P 畫質。
音訊品質比 Wan 2.5 明顯提升,已接近高端模型水準,但與 Veo 3、Sora 2 相比仍會偶爾聽出機械感。