Tvořte 16sekundová AI videa se synchronizovanými dialogy, efekty a hudbou ve Vidu Q3. Rozlišení 1080p, Smart Cuts a podpora češtiny.
Vidu je rodina modelů pro generování AI videa, kterou vyvinula společnost Shengshu Technology ve spolupráci s univerzitou Tsinghua.
Na rozdíl od svých předchůdců (Vidu 1.0 a 1.5), kteří vyžadovali oddělené postupy pro obraz a následnou tvorbu zvuku, je Vidu Q3 generativní engine typu „vše v jednom“.
Aktuální verze: Vidu Q3
Generujte až 16sekundová videa se synchronizovanými dialogy, zvukovými efekty a hudbou na pozadí v jediném kroku. Není potřeba žádná dodatečná postprodukce zvuku.
Vidu Q3 automaticky střídá perspektivy a lokace tak, aby odpovídaly vašemu příběhu. Dialogová scéna může začít celkem, během klíčových momentů přejít do detailů a pak se vrátit k polocelku – to vše z jediného zadání (promptu).
Model rozumí profesionální filmařské mluvě: nájezdy, panorámování, sledovací záběry, oblety i dolly zoomy. Každý snímek působí, jako by měl svého režiséra.
Krátké příběhy: 16sekundová délka + Smart Cuts = kompletní minipříběhy se správným tempem
Produktová videa: Integrovaná hudba a efekty vytvářejí reklamní spoty připravené k okamžitému zveřejnění
Anime a stylizovaná animace: Špičková konzistence 2D stylu a plynulá animace postav
Vícejazyčné kampaně: Nativní generování zvuku zjednodušuje lokalizaci díky podpoře lip-syncu (synchronizace rtů)
Vývoj her a prezentace: Podpora referenčních obrázků pomáhá udržet vizuální identitu v trailerech a prototypech
Strukturujte své zadání jako filmový scénář:
[OBJEKT] + [AKCE] + [PROSTŘEDÍ] + [KAMERA] + [AUDIO]
Příklad:
Mladá žena v červeném kabátě prochází v noci deštěm zmáčenou uličkou v Tokiu.
Neonové nápisy se odrážejí na mokrém chodníku. Zastaví se, vzhlédne a usměje se.
Kamera: Široký sledovací záběr, střih na detail její tváře.
Audio: Zvuk deště, vzdálený provoz, jemná klavírní hudba na pozadí.
Dialog (anglicky): Šeptá „Konečně jsem doma.“
Kamerová terminologie: Používejte výrazy jako „dolly zoom“, „low-angle tracking“ nebo „orbit 360°“
Instrukce pro audio: Vložte tagy jako [SFX: glass shattering] nebo [BGM: suspenseful orchestral]
Ovládání Smart Cuts: Popište jednotlivé střihy scény nebo uveďte „continuous single take, no cuts“ pro záběr bez střihu
Vykreslování textu: Text na obrazovce by měl mít do 5 slov; v promptu uveďte přesné znění
Vícejazyčnost: Pro co nejlepší synchronizaci rtů specifikujte jazyk a emocionální tón
Žádná instalace softwaru; generujte na jakémkoliv zařízení
Otestujte Vidu side-by-side s ostatními předními modely
Stahování ve vysokém rozlišení a bez vodoznaků
Ano. Dialogy, zvukové efekty i hudba jsou vytvářeny přímo v rámci generování. Není potřeba tvořit zvuk zvlášť.
Čínštinu, angličtinu a japonštinu, a to jak pro dialogy, tak pro vykreslování textu ve videu.
Q2 se zaměřuje na konzistenci podle více referencí. Q3 přidává delší stopáž, nativní audio, inteligentní střihy (Smart Cuts) a vykreslování textu.
Ano. Q3 podává špičkové výkony u komplexní fyziky a interakcí mezi více subjekty s vysokou stabilitou.
Vynikající. Vidu je známý svou konzistencí v 2D stylu a plynulou stylizovanou animací.