Somake

Vidu

使用 Vidu Q3 生成 16 秒長度的高畫質 AI 影片,具備自動對對話、環境音效與背景音樂同步功能。支援智慧剪輯與 1080p 輸出,輕鬆跨越語言障礙。

範例
0/2000
設定
時長
5
解析度
長寬比
生成音訊

Vidu AI 影片生成器

Vidu 是由生数科技與清華大學共同研發的 AI 影片生成模型系列。

不同於 Vidu 1.0 和 1.5 需要將畫面生成與音訊後製分開處理,最新的 Vidu Q3 是一款「全能型」生成引擎。

目前版本:Vidu Q3


Vidu Q3 核心功能

原生音視訊同步合成

只需一次指令,即可生成長達 16 秒且同步配備對話、音效與背景音樂的高畫質影片,完全不需要任何音訊後製。

多鏡頭敘事能力

Vidu Q3 會自動根據情節需求切換視角與場景。例如一段對話場景,它能從全景開始,在關鍵時刻切換至近鏡特寫,最後再回到中景——這一切都能透過單一提示詞達成。

電影級鏡頭語言

該模型精通專業攝影語言:包括推鏡 (Push-ins)、平移 (Pans)、跟拍 (Tracking shots)、環繞鏡頭 (Orbit) 以及希區考克變焦 (Dolly zooms),讓每一幀畫面都具備導演運鏡的專業感。

Vidu Q3 最佳使用場景

  • 短篇敘事:16 秒時長搭配智慧剪輯,能拍出節奏分明的完整微縮故事。

  • 產品展示:內建背景音樂與音效,可直接產出供發佈使用的商業短片。

  • 動漫與風格化動畫:業界領先的二維一致性,角色動作流暢自然。

  • 多國語言企劃:原生音訊生成技術支援對嘴同步,大幅簡化在地化工作流程。

  • 遊戲開發與提案素材:支援參考圖輸入,在原型預告片中精確維持視覺風格。

指令編寫指南

請像寫電影簡報一樣編寫提示詞:

[主體] + [動作] + [環境設定] + [鏡頭選擇] + [音效需求]

範例:

一名穿著紅色外套的年輕女子,在夜晚走過潮濕多雨的東京小巷。

霓虹燈招牌倒映在濕漉漉的路面上。她停下腳步,抬頭微笑。

鏡頭:全景跟拍,隨後切換至臉部近鏡特寫。

音效:雨聲環境音、遠處的車流聲、輕柔的鋼琴背景音樂。

對話(英文):她低聲說著 "Finally, I'm home."

進階用戶技巧

  • 專業運鏡術語:嘗試使用 "dolly zoom"、"low-angle tracking" 或 "orbit 360°" 等專業詞彙。

  • 音效提示:在指令中加入 [SFX: glass shattering] (玻璃碎裂聲) 或 [BGM: suspenseful orchestral] (懸疑管弦樂) 等標籤。

  • 智慧剪輯控制:明確描述場景節奏,或註明 "continuous single take, no cuts" (一鏡到底,無剪輯)。

  • 文字呈現:建議將畫面文字控制在 5 個單字以內,並在指令中寫出精確內容。

  • 多語言設定:指定語言及情緒語調,能獲得最佳的對嘴效果。

為什麼選擇 Somake

1

雲端操作

無需安裝軟體,任何裝置皆可直接生成

2

模型權重對比

將 Vidu 與其他頂尖模型並排測試比較

3

商用就緒

提供無浮水印、高解析度的影片下載

常見問題