Est-ce que le Q3 génère l'audio automatiquement ?

Oui. Les dialogues, les effets sonores (SFX) et la musique de fond (BGM) sont produits lors de la génération. Aucune création audio séparée n'est nécessaire.

Quelles sont les langues supportées ?

Le chinois, l'anglais et le japonais sont supportés pour les dialogues et le rendu de texte dans la vidéo.

Quelle est la différence entre le Q2 et le Q3 ?

Le Q2 se concentre sur la cohérence multi-références. Le Q3 ajoute une durée étendue, l'audio natif, les Smart Cuts et le rendu de texte.

Le Q3 peut-il gérer les scènes d'action ?

Oui. Le Q3 est très performant pour la physique complexe et les interactions entre plusieurs sujets avec une grande stabilité.

Le Q3 est-il adapté aux anime ?

Excellent. Vidu est réputé pour sa cohérence en 2D et son animation fluide de style dessin animé.

Vidu

Créez des vidéos AI de 16s avec dialogues synchronisés, SFX et musique via Vidu Q3. Montage intelligent, rendu 1080p et support multi-langues inclus.

Exemples

Générateur Vidu AI

Vidu est une famille de modèles de génération vidéo par IA développée par Shengshu Technology et l'Université Tsinghua.

Contrairement à ses prédécesseurs (Vidu 1.0 et 1.5) qui nécessitaient des flux de travail séparés pour le visuel et la post-production audio, Vidu Q3 est un moteur génératif "tout-en-un".

Version actuelle : Vidu Q3

Fonctionnalités clés de Vidu Q3

Synthèse Audio-Vidéo Native

Générez jusqu'à 16 secondes de vidéo synchronisée avec dialogues, effets sonores et musique de fond en une seule commande. Plus besoin de post-production audio.

Narration Multi-Prises

Vidu Q3 change automatiquement de perspective et de lieu pour s'adapter à votre récit. Une scène de dialogue peut commencer par un plan large, passer à des gros plans lors des moments clés, et revenir à un plan moyen—le tout à partir d'un seul prompt.

Intelligence Cinématographique

Le modèle maîtrise le langage des caméras professionnelles : travellings avant, panoramiques, plans de suivi, angles orbitaux et zooms compensés (dolly zooms). Chaque image semble avoir été dirigée intentionnellement.

Meilleurs cas d'utilisation pour Vidu Q3

Récits courts : Durée de 16 secondes + Smart Cuts = de mini-histoires complètes avec un bon rythme.
Présentations de produits : La musique de fond et les effets sonores intégrés permettent de produire des clips publicitaires prêts à être publiés.
Anime & Animation stylisée : Une cohérence 2D leader sur le marché et une animation de personnages fluide.
Campagnes multilingues : La génération audio native simplifie la localisation grâce au support de la synchronisation labiale (lip-sync).
Développement de jeux & Pitchs : Le support d'images de référence maintient l'identité visuelle à travers les bandes-annonces de prototypes.

Guide des prompts

Structurez vos prompts comme un brief de film :

[SUJET] + [ACTION] + [CADRE] + [CAMÉRA] + [AUDIO]

Exemple :

Une jeune femme en manteau rouge marche dans une ruelle de Tokyo sous la pluie, de nuit.
Les enseignes néon se reflètent sur le pavé mouillé. Elle s'arrête, lève les yeux et sourit.
Caméra : Plan de suivi large, puis coupe sur un gros plan de son visage.
Audio : Ambiance de pluie, trafic lointain, musique de fond douce au piano.
Dialogue (Français) : Elle murmure "Enfin, je suis à la maison."

Conseils pour les experts

Langage de caméra : Utilisez des termes comme "dolly zoom," "low-angle tracking," ou "orbit 360°".
Indices audio : Incluez [SFX: glass shattering] ou [BGM: suspenseful orchestral].
Contrôle des Smart Cuts : Décrivez explicitement les moments de la scène ou précisez "continuous single take, no cuts".
Rendu de texte : Gardez le texte à l'écran sous les 5 mots ; indiquez le libellé exact dans le prompt.
Multilingue : Précisez la langue et le ton émotionnel pour une synchronisation labiale optimale.