Wan
Wan 2.7 幫你輕鬆做出電影感 AI 影片!支援首尾幀控制、影片編輯與 9 宮格分鏡圖輸入,內建強大推理功能,快速產出高品質專業創作。
什麼是 Wan
Wan 是由阿里巴巴集團通義實驗室(Tongyi Lab)開發的開源 AI 影片生成模型系列。Wan 系列代表了阿里巴巴在多模態 AI 領域的旗艦級成果,旨在將文字提示、圖片及參考影片轉化為具有真實動態與視覺一致性的高品質影片內容。
於 2026 年 4 月發佈的 Wan 2.7,從單純的生成模型顯著擴展為更全面的影片製作工具箱 —— 新增了幀級控制、基於指令的影片編輯,以及內建的推理層。無論你是正在產出廣告方案的行銷人員,還是進行場景預覽的電影製作者,此版本提供的實用工具都能解決實際生產中的瓶頸。你可以在 Somake AI 的左側面板中切換目前的 Wan 2.7 或舊版本。
目前版本:Wan 2.7(2026 年 4 月)
快速概覽
| 屬性 | 細節 |
|---|---|
| 模型版本 | Wan 2.7 |
| 開發商 | 阿里巴巴集團 — 通義實驗室 |
| 發佈日期 | 2026 年 4 月 |
| 核心優勢 | 首尾幀控制、影片對影片編輯、連鎖思維推理(CoT) |
| 最適合用戶 | 行銷人員、教育工作者、獨立電影人、社群媒體創作者 |
Wan 2.7 — 最新更新
Wan 2.7 將 Wan 系列從標準的生成模型擴展為更全面的影片製作套件。此版本引入了幀級精確度、透過文字指令編輯既有素材的能力,以及用於更精確構圖的內部推理引擎。
Wan 2.7 的主要改進:
首尾幀生成:可指定起始幀和結束幀,模型會自動計算並生成邏輯連貫、平滑的動態與轉場。
影片對影片編輯(Video-to-Video Edit):上傳現有的影片片段,使用自然語言指令修改風格、環境或光影,同時保留原始的動作結構。
9 宮格圖轉影片:將 3×3 的分鏡腳本圖陣列,轉換為單一、連續且連貫的影片敘事。
連鎖思維推理(思考模式):內建推理層可確保更準確的提示詞理解、更強的構圖結構,並能清晰呈現 12 種語言的文字內容。
改進的主體參考:提升了身份鎖定功能,使角色和物體在跨幀生成時保持一致性。(註:部分進階多重參考功能可能尚未在所有第三方平台開放。)
舊版本精彩回顧 (Wan 2.6):
以下功能於 Wan 2.6(2025 年 12 月)推出,目前仍是模型能力的一部分:
多角色對話與清晰的人聲分離
角色參考系統(最多支援 3 個參考物)— 目前 Somake 尚未支援
透過人臉和人聲樣本建立個人虛擬化身(Avatar)— 目前 Somake 尚未支援
透過提示詞控制環境與服裝
原生視聽同步技術
客觀優缺點分析
✅ 優勢(v2.7 版本):
「思考模式」產出的構圖明顯更精準,文字呈現更清晰
9 宮格分鏡圖輸入橋接了企劃與製作流程
維持開源特性,為開發者提供自定義部署的彈性
沿用自 2.5/2.6 版本的原生視聽同步功能
⚠️ 局限(v2.7 版本):
語音真實度與情感表現仍落後於 Veo 3 和 Sora 2 等頂尖閉源對手
包含多個角色的複雜動作序列仍可能產生視覺瑕疵
動漫風格的影片生成能力相比寫實風格仍較弱 —— 這一點自 Wan 2.6 以來未有顯著改善
輸出內容偶爾仍會出現語言不匹配的情形,儘管頻率低於先前版本
最佳應用場景
行銷人員與小型企業
快速產出社群廣告: 需要一段吸睛的 10 秒 Instagram 影片?只要輸入:「一雙新款球鞋濺過水窪的動態鏡頭,電影感,充滿能量」,幾分鐘內就能得到專業級廣告。
產品視覺化: 在任何想像得到的場景中展示產品。例如:「放在溫暖雨夜巴黎咖啡館桌上的新款咖啡杯,杯口冒著熱氣」。
前後對比序列: 利用首尾幀控制精確產出產品轉變影片 —— 非常適合保養品、裝修或烹飪教學內容。
教育工作者與學生
歷史視覺化: 老師可以生成「羅馬士兵隊伍穿過森林的低視角鏡頭」,讓課堂內容更生動有趣。
科學原理說明: 學生可以製作影片解釋複雜主題,例如:「一段穿梭植物細胞的動畫旅程,展示粒線體運作的樣子」。
藝術家與獨立電影人
快速原型設計: 迅速將劇本中的場景視覺化,測試氛圍與構圖是否可行,省下寶貴的時間與資源。9 宮格分鏡圖輸入讓這個過程特別高效。
獨特視覺特效(VFX): 生成超現實、夢幻般的序列或抽象背景,這些內容在現實中往往難以拍攝或無法拍攝。
後期製作風格嘗試: 在投入手動編輯前,利用「影片對影片」編輯功能,在現有素材上測試不同的色調、光影條件或環境變化。
對比分析:Wan 2.7 vs 競爭對手
| 功能 | Wan 2.7 | Veo 3.1 | Sora 2 |
|---|---|---|---|
| 最高解析度 | 1080P | 4K | 1080P |
| 最長持續時間 | 15 秒 | 8 秒 | 20 秒 |
| 音訊真實度 | 堪用,略帶機械感 | 業界領先 | 強悍、自然 |
| 是否開源 | 是 | 否 | 否 |
| 影片對影片編輯 | 是 | 否 | 否 |
| 文字呈現能力 | 優秀 | 優秀 | 一般 |
| 價格方案 | 免費 (開源) / 視平台而定 | 專業付費 | 專業付費 |
優勢總結:
對於需要開源彈性、幀級控制以及低預算影片編輯功能的用戶來說,Wan 2.7 是最強大的選擇。
Veo 3.1 在音訊真實度與解析度上領先 —— 如果語音品質是關鍵且預算充足,這是更好的選擇。
Sora 2 提供更長的片段與自然的音效,適合製作長篇敘事序列。
你可以在 Somake AI 上將 Wan 2.7 與這些模型(以及 Kling、Seedance 等)並排比較,無需切換平台。
Wan 2.6 進階提示詞技巧
多鏡頭敘事提示詞範本
一段電影感的 [類型] 場景。
鏡頭 1:[全景/中景/特寫],[描述場景、角色與動作]。
鏡頭 2:[鏡頭角度],[描述轉場與新的視覺焦點]。
鏡頭 3:[鏡頭角度],[描述結局或最終時刻]。
風格:[寫實/電影感/風格化]。光影:[自然/戲劇化/柔和]。
首尾幀提示詞範本
一段電影感的 [類型] 場景。
起始幀:[描述初始構圖、角色與照明]。
動作/轉場:[描述動態、運鏡與互動]。
結束幀:[描述最終畫面]。
風格:[寫實/電影感/風格化]。文字渲染:「[在括號內包含想出現在畫面上的具體文字]」。
提示詞擴展功能
當你的輸入較為簡單,或想要更豐富的視覺細節時,請啟用提示詞擴展(Prompt Expansion)。系統會添加描述性元素,以改善輸出的構圖、風格一致性與視覺連貫性。
常見問題排查
問題:人聲聽起來很機械或不自然
→ 解決方案:截至 Wan 2.7 這仍是模型的局限。若專案需要高度真實或感性的聲音,請考慮將生成的影片與外部錄製的音訊合成。
問題:出現非預期的角色或超現實元素
→ 解決方案:雖然 Wan 2.7 的思考模式減少了這類瑕疵,但在提示詞過於複雜時仍可能發生。請簡化你的提示詞並重新生成。
問題:動作場面出現視覺扭曲
→ 解決方案:包含多個角色的複雜動作序列是已知弱點。請將動態場景拆解為多個較簡單的鏡頭,並利用「首尾幀」功能精確控制動作的起點與終點。
問題:招牌或衣服上的文字亂碼
→ 解決方案:Wan 2.7 已透過思考模式提升了 12 種語言的文字呈現。如果文字仍有亂碼,請在提示詞中明確將文字用引號包覆,並避免混用相互矛盾的參考圖片。
為什麼選擇 Somake 來開啟你的 AI 影片創作?
無需任何技術門檻
Wan 2.7 若要在本地運行需要特定的硬體規格。Somake AI 將模型託管於雲端,讓你突破硬體限制,透過簡單直覺的網頁界面即可直接生成。
全方位創作中心
在單一平台上處理圖片與影片生成,簡化從構思到產出的工作流程。無需切換工具,即可直接對比 Wan 2.7 與 Kling、Seedance、PixVerse 等頂尖模型的表現。
商業使用授權
付費訂閱用戶擁有創作內容的完整商業權限,可以輕鬆將產出的成果用於廣告、行銷活動及客戶專案中。







