Luo 16 sekunnin AI-videoita puheella ja äänitehosteilla Vidu Q3:lla. Smart Cuts, 1080p-laatu ja tuki usealle kielelle yhdellä työkalulla.
Vidu on Shengshu Technologyn ja Tsinghua-yliopiston kehittämä tekoälypohjaisten videomallien perhe.
Toisin kuin edeltäjänsä (Vidu 1.0 ja 1.5), jotka vaativat erilliset työvaiheet videon ja äänen luomiseen, Vidu Q3 on "kaikki yhdessä" -moottori.
Nykyinen versio: Vidu Q3
Luo jopa 16 sekuntia synkronoitua videota puheen, äänitehosteiden ja taustamusiikin kera yhdellä kertaa. Jälkituotannolle ja erilliselle äänityölle ei ole tarvetta.
Vidu Q3 vaihtaa automaattisesti kuvakulmia ja paikkoja tarinasi mukaan. Keskustelukohtaus voi alkaa laajakuvasta, siirtyä lähikuviin tärkeissä hetkissä ja palata puolilähikuvaan – kaikki täysin yhden kehotteen (prompt) perusteella.
Malli ymmärtää ammattimaista elokuvakieltä: zoomaukset, panoroinnit, seuranta-ajot, kiertävät kulmat ja vastazoomaukset (dolly zoom). Jokainen ruutu tuntuu tarkoituksella ohjatulta.
Lyhyet tarinat: 16 sekunnin kesto + Smart Cuts -leikkaukset = valmiita minitarinoita oikealla rytmityksellä
Tuote-esittelyt: Integroitu taustamusiikki ja äänitehosteet tuottavat julkaisunvalmiita mainoksia
Anime ja tyylitelty animaatio: Alan johtava 2D-jatkuvuus ja sujuvat hahmoliikkeet
Monikieliset kampanjat: Integroitu äänentuotto helpottaa lokalisointia huulisynkronointituen avulla
Pelikehitys ja myyntimateriaalit: Lähdekuvien (reference image) tuki säilyttää visuaalisen ilmeen kaikissa prototyyppitrailereissa
Rakenna kehotteet kuin tekisit lyhyen elokuvakäsikirjoituksen:
[AIHE] + [TOIMINTA] + [YMPÄRISTÖ] + [KAMERA] + [ÄÄNI]
Esimerkki:
Nuori nainen punaisessa takissa kävelee sateisella Tokion kujalla yöllä.
Neonvalot heijastuvat märästä asfaltista. Hän pysähtyy, katsoo ylös ja hymyilee.
Kamera: Laaja seuranta-ajo, leikkaus lähikuvaan kasvoista.
Ääni: Sateen ääniä, kaukainen liikenne, pehmeä pianomusiikki taustalla.
Puhe (englanti): Hän kuiskaa "Finally, I'm home."
Kamerakieli: Käytä termejä kuten "dolly zoom," "low-angle tracking," tai "orbit 360°"
Ääniohjeet: Lisää esimerkiksi [SFX: glass shattering] tai [BGM: suspenseful orchestral]
Smart Cuts -hallinta: Kuvaile kohtauksen käänteet tarkasti tai määrittele "continuous single take, no cuts"
Tekstin renderöinti: Pidä videolla näkyvä teksti alle 5 sanassa; kerro tarkka sanamuoto kehotteessa
Monikielisyys: Määrittele kieli ja tunnetila parasta huulisynkronointia varten
Ei ohjelmistoasennuksia; luo videoita millä tahansa laitteella
Testaa Vidua muiden johtavien mallien rinnalla
Ei vesileimoja, korkean resoluution lataukset
Kyllä. Puhe, äänitehosteet ja taustamusiikki luodaan osana videon generointia. Erillistä äänityötä ei tarvita.
Kiina, englanti ja japani ovat tuettuja sekä puheessa että videon tekstien renderöinnissä.
Q2 keskittyy monen lähteen jatkuvuuteen. Q3 tuo mukanaan pidemmän keston, integroidun äänen, Smart Cuts -leikkaukset ja tekstin renderöinnin.
Kyllä. Q3 on erinomainen monimutkaisten fysiikoiden ja useiden kohteiden välisten vuorovaikutusten luomisessa korkealla vakaudella.
Loistavasti. Vidu on tunnettu 2D-laadustaan ja sujuvasta tyylitellystä animaatiosta.