Wan
Wan 2.7は、シネマティックなAI動画を生成。開始・終了フレームの制御、動画編集、9分割絵コンテ入力、高度な推論機能を搭載しています。
Wanとは
Wanは、アリババグループの通義ラボ(Tongyi Lab)が開発したオープンソースのAI動画生成モデルシリーズです。アリババのマルチモーダルAIにおけるフラッグシッププロジェクトであり、テキストプロンプト、画像、リファレンス動画を、リアルな動きと視覚的な一貫性を備えた高品質な動画コンテンツへと変換するために設計されました。
2026年4月にリリースされた「Wan 2.7」は、単なる生成モデルから、より幅広い動画制作ツールキットへと大きく進化しました。フレーム単位の制御、指示ベースの動画編集、そして内蔵の推論レイヤーが追加されています。広告コンセプトを試作するマーケターの方から、シーンを事前視覚化する映画製作者の方まで、制作現場のボトルネックを解消する実用的なツールが揃っています。Somake AIの左パネルから、Wanの最新バージョンおよび旧バージョンを選択してご利用いただけます。
現在のバージョン: Wan 2.7(2026年4月)
クイック概要
| 属性 | 詳細 |
|---|---|
| モデルバージョン | Wan 2.7 |
| 開発元 | アリババグループ — 通義ラボ |
| リリース日 | 2026年4月 |
| 主な強み | 開始・終了フレーム制御、動画間(V2V)編集、思考の連鎖による推論 |
| 対象ユーザー | マーケター、教育関係者、自主映画制作者、SNSクリエイター |
Wan 2.7 — 最新のアップデート内容
Wan 2.7は、これまでの標準的な生成モデルから、より包括的な動画制作スイートへと拡張されました。今回のリリースでは、フレームレベルの精度、テキスト指示による既存映像の編集機能、そしてより正確な構図を実現するための内部推論エンジンが導入されています。
Wan 2.7の主な改善点:
開始・終了フレーム生成: 開始フレームと終了フレームの両方を指定できます。モデルがその2点間を論理的につなぐために必要な、滑らかな動きとトランジションを計算して生成します。
動画から動画への編集(Video-to-Video): 既存の動画クリップをアップロードし、自然なテキスト指示を使って、元の動きの構造を保ったままスタイル、環境、照明を変更できます。
9分割画像からの動画生成: 3×3グリッドの絵コンテカットを、ひとつの連続した一貫性のあるストーリー動画に変換します。
思考の連鎖・推論(Thinking Mode): 内蔵の推論レイヤーにより、プロンプトの解釈がより正確になり、構図も強化されました。また、12言語で判読可能なテキスト描画が可能です。
被写体参照の向上: キャラクターやオブジェクトのアイデンティティを固定する機能が向上し、フレーム間での一貫性が高まりました。(注:一部の高度なマルチリファレンス機能は、サードパーティ製プラットフォームではまだ利用できない場合があります。)
前バージョンのハイライト(Wan 2.6):
以下の機能はWan 2.6(2025年12月)で導入され、引き続き本モデルの機能として利用可能です。
クリアな音声分離を備えた複数キャラクターの対話
キャラクター参照システム(最大3枚まで) — ※Somakeでは未対応
顔と音声サンプルからの個人アバター作成 — ※Somakeでは未対応
プロンプトによる環境と衣装のコントロール
ネイティブな音声・映像同期
客観的なメリットとデメリット
✅ 強み(v2.7時点):
「Thinking Mode」により、構図の正確さとテキストの読みやすさが格段に向上
9分割絵コンテ入力により、企画から制作ワークフローへの橋渡しがスムーズに
オープンソースを維持しており、開発者がカスタム展開できる柔軟性がある
2.5/2.6から引き継がれたネイティブな音声・映像同期機能
⚠️ 制限事項(v2.7時点):
音声のリアルさや感情表現は、依然としてVeo 3やSora 2といった有料の非公開モデルに後れを取っている
複数のキャラクターが登場する複雑なアクションシーンでは、視覚的なノイズ(アーティファクト)が発生する場合がある
アニメスタイルの動画生成は実写スタイルに比べてまだ弱く、これはWan 2.6以降、大幅な改善は見られていない
以前のバージョンより頻度は減ったものの、出力時に一部の言語の不一致が発生することがある
最適な活用シーン
マーケター・中小企業の方へ
スピーディーなSNS広告: Instagram用の目を引く10秒動画が必要ですか?「水たまりを跳ね飛ばしながら走る新作スニーカーのダイナミックなショット、シネマティック、ハイエネルギー」と入力するだけで、数分でプロレベルの広告が完成します。
商品の視覚化: あらゆるシチュエーションでの商品動画を作成できます。「雨の降るパリの居心地の良いカフェで、湯気が立ち上るデスクの上の新しいコーヒーマグ。 」
ビフォーアフター映像: 開始・終了フレーム制御を使用して、スキンケア、リフォーム、料理の工程など、商品の正確な変化を見せる動画を作成するのに最適です。
教育関係者・学生の方へ
歴史の視覚化: 先生が「低いアングルから見た、森を行進するローマ軍の兵士」のクリップを生成すれば、授業をより魅力的にすることができます。
科学の解説: 学生が「ミトコンドリアの働きを示す、植物細胞の中のアニメーションの旅」のような動画を作成して、複雑なトピックを分かりやすく説明できます。
アーティスト・自主映画制作者の方へ
迅速なプロトタイピング: 脚本のシーンを素早く視覚化して、ムードや構図がうまくいくかテストでき、貴重な時間とリソースを節約できます。9分割絵コンテ入力を使えば、さらに効率的です。
ユニークな視覚効果(VFX): 実写での撮影が困難、あるいは不可能な、超現実的で夢のようなシーケンスや抽象的な背景映像を生成できます。
ポストプロダクションでのスタイル変更: 動画間(V2V)編集を使用して、手動で編集作業を行う前に、既存の映像で別のカラーグレーディング、照明条件、または環境の変化を試すことができます。
比較:Wan 2.7 vs 競合モデル
| 機能 | Wan 2.7 | Veo 3.1 | Sora 2 |
|---|---|---|---|
| 最大解像度 | 1080P | 4K | 1080P |
| 最大再生時間 | 15秒 | 8秒 | 20秒 |
| 音声のリアルさ | 実用的だが、やや機械的 | 業界トップクラス | 強力で自然 |
| オープンソース | はい | いいえ | いいえ |
| 動画編集(V2V) | はい | いいえ | いいえ |
| テキスト描画 | 良好 | 良好 | 標準的 |
| 料金 | 無料(オープンソース)/ プラットフォームに依存 | プレミアム(高額) | プレミアム(高額) |
各モデルの使い分け:
Wan 2.7 は、オープンソースの柔軟性を求め、低コストでフレーム単位の制御や動画編集機能が必要なユーザーにとって最強の選択肢です。
Veo 3.1 は、音声のリアルさと解像度で他を圧倒しています。音声の質が極めて重要で、予算に余裕がある場合に適しています。
Sora 2 は、より長いクリップと自然な音声を提供し、長い物語のシーケンスに適しています。
Somake AIでは、Wan 2.7をKlingやSeedanceなどの他のモデルと、画面を切り替えることなく並べて比較できます。
Wan 2.6向け 高度なプロンプトのコツ
マルチショット・ストーリーテリング プロンプト テンプレート
シネマティックな[ジャンル]のシーン。
ショット1:[ワイド/ミディアム/クローズアップ]ショット、[シーン、キャラクター、アクションの内容]。
ショット2:[カメラアングル]、[トランジションと次のフォーカスの内容]。
ショット3:[カメラアングル]、[結末または最後の瞬間の内容]。
スタイル:[リアル/シネマティック/様式化]。照明:[自然光/ドラマチック/ソフト]。
開始/終了フレーム プロンプト テンプレート
シネマティックな[ジャンル]のシーン。
開始フレーム:[開始時の構図、キャラクター、照明の説明]。
アクション/トランジション:[動き、カメラワーク、インタラクションの説明]。
終了フレーム:[最終的な着地点の説明]。
スタイル:[リアル/シネマティック/様式化]。テキスト描画:"[画面に表示させたい特定のテキストを引用符で囲んで入力]"。
プロンプト拡張(Prompt Expansion)
入力がシンプルな場合や、より豊かな視覚的詳細が欲しい場合は、プロンプト拡張を有効にしてください。システムが描写要素を追加し、出力の構図、スタイルの貫性、視覚的なまとまりを向上させます。
よくある問題のトラブルシューティング
問題:音声がロボットのようで不自然
→ 解決策:これはWan 2.7時点での制限事項です。非常にリアルな、または感情豊かな音声を必要とするプロジェクトの場合は、動画のみを生成し、別途生成または録音した音声と組み合わせることを検討してください。
問題:予期しないキャラクターや非現実的な要素が現れる
→ 解決策:Wan 2.7のThinking Mode(思考モード)はこうしたノイズを軽減しますが、プロンプトに情報を詰め込みすぎると発生することがあります。プロンプトをシンプルにして再度生成を試してください。
問題:アクションシーンの映像が歪む
→ 解決策:複数のキャラクターが登場する複雑なアクションシーケンスは、既知の弱点です。ダイナミックなシーンをシンプルなショットに分割し、開始・終了フレーム機能を使用して動きの始点と終点を明示的に制御してください。
問題:看板や衣服の文字が文字化けする
→ 解決策:Wan 2.7では、Thinking Modeにより12言語のテキスト描画が改善されました。それでも文字化けする場合は、プロンプト内で表示したいテキストを明示的に引用符(" ")で囲み、矛盾する参照画像を混ぜないようにしてください。
Somake AIが動画制作に選ばれる理由
専門スキルは不要
Wan 2.7をローカルで実行するには特定のハードウェアが必要ですが、Somake AIはモデルをクラウド上にホストしています。ハードウェアの制限を気にすることなく、直感的なウェブインターフェースから動画を生成できます。
オールインワンのクリエイティブスイート
画像と動画の両方の生成を1つのプラットフォームで完結でき、コンセプト作りから最終出力までのワークフローを効率化。Wan 2.7をKling、Seedance、PixVerseなどのトップモデルと、ツールを切り替えずに比較できます。
商用利用が可能
有料プランをご契約いただくと、作成したコンテンツの完全な商用利用権が付与されます。広告、キャンペーン、クライアント案件などにも安心して活用いただけます。







