Créez des vidéos AI de 16s avec dialogues synchronisés, SFX et musique via Vidu Q3. Montage intelligent, rendu 1080p et support multi-langues inclus.
Vidu est une famille de modèles de génération vidéo par IA développée par Shengshu Technology et l'Université Tsinghua.
Contrairement à ses prédécesseurs (Vidu 1.0 et 1.5) qui nécessitaient des flux de travail séparés pour le visuel et la post-production audio, Vidu Q3 est un moteur génératif "tout-en-un".
Version actuelle : Vidu Q3
Générez jusqu'à 16 secondes de vidéo synchronisée avec dialogues, effets sonores et musique de fond en une seule commande. Plus besoin de post-production audio.
Vidu Q3 change automatiquement de perspective et de lieu pour s'adapter à votre récit. Une scène de dialogue peut commencer par un plan large, passer à des gros plans lors des moments clés, et revenir à un plan moyen—le tout à partir d'un seul prompt.
Le modèle maîtrise le langage des caméras professionnelles : travellings avant, panoramiques, plans de suivi, angles orbitaux et zooms compensés (dolly zooms). Chaque image semble avoir été dirigée intentionnellement.
Récits courts : Durée de 16 secondes + Smart Cuts = de mini-histoires complètes avec un bon rythme.
Présentations de produits : La musique de fond et les effets sonores intégrés permettent de produire des clips publicitaires prêts à être publiés.
Anime & Animation stylisée : Une cohérence 2D leader sur le marché et une animation de personnages fluide.
Campagnes multilingues : La génération audio native simplifie la localisation grâce au support de la synchronisation labiale (lip-sync).
Développement de jeux & Pitchs : Le support d'images de référence maintient l'identité visuelle à travers les bandes-annonces de prototypes.
Structurez vos prompts comme un brief de film :
[SUJET] + [ACTION] + [CADRE] + [CAMÉRA] + [AUDIO]
Exemple :
Une jeune femme en manteau rouge marche dans une ruelle de Tokyo sous la pluie, de nuit.
Les enseignes néon se reflètent sur le pavé mouillé. Elle s'arrête, lève les yeux et sourit.
Caméra : Plan de suivi large, puis coupe sur un gros plan de son visage.
Audio : Ambiance de pluie, trafic lointain, musique de fond douce au piano.
Dialogue (Français) : Elle murmure "Enfin, je suis à la maison."
Langage de caméra : Utilisez des termes comme "dolly zoom," "low-angle tracking," ou "orbit 360°".
Indices audio : Incluez [SFX: glass shattering] ou [BGM: suspenseful orchestral].
Contrôle des Smart Cuts : Décrivez explicitement les moments de la scène ou précisez "continuous single take, no cuts".
Rendu de texte : Gardez le texte à l'écran sous les 5 mots ; indiquez le libellé exact dans le prompt.
Multilingue : Précisez la langue et le ton émotionnel pour une synchronisation labiale optimale.
Aucune installation de logiciel ; générez sur n'importe quel appareil.
Testez Vidu face aux autres modèles leaders côte à côte.
Téléchargements en haute résolution et sans filigrane.
Oui. Les dialogues, les effets sonores (SFX) et la musique de fond (BGM) sont produits lors de la génération. Aucune création audio séparée n'est nécessaire.
Le chinois, l'anglais et le japonais sont supportés pour les dialogues et le rendu de texte dans la vidéo.
Le Q2 se concentre sur la cohérence multi-références. Le Q3 ajoute une durée étendue, l'audio natif, les Smart Cuts et le rendu de texte.
Oui. Le Q3 est très performant pour la physique complexe et les interactions entre plusieurs sujets avec une grande stabilité.
Excellent. Vidu est réputé pour sa cohérence en 2D et son animation fluide de style dessin animé.