Vidu
使用 Vidu Q3 生成 16 秒長度的高畫質 AI 影片,具備自動對對話、環境音效與背景音樂同步功能。支援智慧剪輯與 1080p 輸出,輕鬆跨越語言障礙。
Vidu AI 影片生成器
Vidu 是由生数科技與清華大學共同研發的 AI 影片生成模型系列。
不同於 Vidu 1.0 和 1.5 需要將畫面生成與音訊後製分開處理,最新的 Vidu Q3 是一款「全能型」生成引擎。
目前版本:Vidu Q3
Vidu Q3 核心功能
原生音視訊同步合成
只需一次指令,即可生成長達 16 秒且同步配備對話、音效與背景音樂的高畫質影片,完全不需要任何音訊後製。
多鏡頭敘事能力
Vidu Q3 會自動根據情節需求切換視角與場景。例如一段對話場景,它能從全景開始,在關鍵時刻切換至近鏡特寫,最後再回到中景——這一切都能透過單一提示詞達成。
電影級鏡頭語言
該模型精通專業攝影語言:包括推鏡 (Push-ins)、平移 (Pans)、跟拍 (Tracking shots)、環繞鏡頭 (Orbit) 以及希區考克變焦 (Dolly zooms),讓每一幀畫面都具備導演運鏡的專業感。
Vidu Q3 最佳使用場景
短篇敘事:16 秒時長搭配智慧剪輯,能拍出節奏分明的完整微縮故事。
產品展示:內建背景音樂與音效,可直接產出供發佈使用的商業短片。
動漫與風格化動畫:業界領先的二維一致性,角色動作流暢自然。
多國語言企劃:原生音訊生成技術支援對嘴同步,大幅簡化在地化工作流程。
遊戲開發與提案素材:支援參考圖輸入,在原型預告片中精確維持視覺風格。
指令編寫指南
請像寫電影簡報一樣編寫提示詞:
[主體] + [動作] + [環境設定] + [鏡頭選擇] + [音效需求]
範例:
一名穿著紅色外套的年輕女子,在夜晚走過潮濕多雨的東京小巷。
霓虹燈招牌倒映在濕漉漉的路面上。她停下腳步,抬頭微笑。
鏡頭:全景跟拍,隨後切換至臉部近鏡特寫。
音效:雨聲環境音、遠處的車流聲、輕柔的鋼琴背景音樂。
對話(英文):她低聲說著 "Finally, I'm home."
進階用戶技巧
專業運鏡術語:嘗試使用 "dolly zoom"、"low-angle tracking" 或 "orbit 360°" 等專業詞彙。
音效提示:在指令中加入
[SFX: glass shattering](玻璃碎裂聲) 或[BGM: suspenseful orchestral](懸疑管弦樂) 等標籤。智慧剪輯控制:明確描述場景節奏,或註明 "continuous single take, no cuts" (一鏡到底,無剪輯)。
文字呈現:建議將畫面文字控制在 5 個單字以內,並在指令中寫出精確內容。
多語言設定:指定語言及情緒語調,能獲得最佳的對嘴效果。
為什麼選擇 Somake
雲端操作
無需安裝軟體,任何裝置皆可直接生成
模型權重對比
將 Vidu 與其他頂尖模型並排測試比較
商用就緒
提供無浮水印、高解析度的影片下載







