Entdecke die lautlose Videogenerierung von Midjourney. Ein kompletter Guide, wie du Kunst in Bewegung umwandelst, mit Vergleich von Sora vs. Midjourney und mehr.
Keine Einträge gefunden
Erstellung fehlgeschlagen
Im rasant wachsenden Feld der generativen Videos, in dem Branchenriesen wie OpenAI’s Sora und Google’s Veo um Hyperrealismus und kommerzielle Anwendungen konkurrieren, geht Midjourney einen ganz eigenen, vielleicht sogar raffinierteren Weg. Ihr Ziel ist es (noch) nicht, das Filmteam zu ersetzen, sondern die Leinwand zum Leben zu erwecken.
Hier bekommst du die technische Anleitung, wie du das Tool meisterst, wie es sich wirtschaftlich gegen andere behauptet und wo es in deinem kreativen Workflow Sinn macht.
Das aktuelle Midjourney Video-Modell ist im Grunde eine Image-to-Video-Engine. Sie nimmt ein generiertes oder hochgeladenes Bild und macht daraus animierte Clips von 5 Sekunden Länge.
Anders als Veo oder Sora, die meist auf zeitliche Konsistenz für erzählerische Szenen setzen, legt Midjourney Wert auf Textur, Licht und Tiefe. Das Video wird wie ein bewegtes Gemälde behandelt.
Dauer: 5-Sekunden-Loops (verlängerbar durch Aneinanderfügen).
Audio: Keins. Das Ergebnis bleibt stumm – es ist ein visuelles Tool, kein Regisseur für Ton und Bild.
Das bedeutet: Für Dialogszenen oder komplexe Bewegungsfolgen ist das Tool nicht gemacht. Es glänzt bei filmischen Momenten, Stimmungs-Clips oder animierter Konzeptkunst.
Low Motion: Die sichere Wahl! Funktioniert bestens für Porträts, Produktaufnahmen oder detaillierte Architektur. Es entstehen atmosphärische Bewegungen – Staub, der schwebt, sich bewegendes Haar, sanfte Lichtänderungen.
High Motion: Dramatische Kamerafahrten und kräftige Bewegungen von Objekten oder Personen.
Höhere Qualitätswerte sorgen für feinere Texturen und Lichtberechnungen, verlängern aber deutlich die Renderzeit (und verbrauchen mehr GPU-Minuten).
Das ist dein Hauptregler für die Optik. Er bestimmt, wie stark das Modell sich an Midjourneys eigene "Schönheitsstandards" statt an deinen Prompt hält.
Niedrige Werte (50–150): Viel Kontrolle über den Prompt, aber weniger optische Einheitlichkeit.
Typischer Einsatz: Hybride Konzepte oder spezifische Kreaturendesigns (zum Beispiel ein "Katzen-Drache"). Wenn die Anatomie möglichst nah am Prompt sein soll, halte den Stilwert niedrig.
Hohe Werte (250–750): Mehr optische Einheitlichkeit, weniger genaue Umsetzung des Prompts.
Typischer Einsatz: Wenn du den typischen "Midjourney-Look" willst – weich, malerisch und ästhetisch, auch wenn Details vom Prompt vernachlässigt werden.
Chaos: Steuert die Vielfalt im Startbild. Im Video heißt das: Wie stark sich die Komposition bei der Erstellung verändert.
Weird: Bringt experimentelle, surreale Effekte ins Bild. Lieber sparsam verwenden – außer du stehst auf Traumlandschaften oder abstrakten Horror.
Für Schönheit: --stylize 300 --chaos 0 --weird 0 (High Motion bei Landschaften)
Für Präzision: --stylize 100 --chaos 0 --weird 0 (Low Motion bei Figuren)
Midjourney ist erstaunlich konkurrenzfähig – besonders, wenn du kostengünstig hochwertige Experimente willst.
Auflösung: 720p; Dauer: 4-5s:
Sora 2: ~80 Credits/Video
Sora 2 Pro: ~240 Credits/Video
Veo 3.1 Schnell (Audio aus): ~80 Credits/Video
Veo 3.1 (Audio aus): ~160 Credits/Video
Midjourney: ~100 Credits
Für eine objektive Einschätzung sollten wir berücksichtigen, wo das Modell noch Schwächen hat.
Kein Skelett-Rigging: Das Modell "denkt" in Pixeln, nicht in Anatomie. Es weiß nicht, dass ein Ellenbogen sich nur in eine Richtung biegt. Komplexe Bewegungsabläufe (Kämpfen, Tanzen) wirken oft verstörend.
Stille: Da kein Ton erzeugt wird, musst du dich beim Zusammenschnitt selbst um den finalen Sound kümmern.
Setzt auf die Bewahrung deines ursprünglichen Kunststils.
Auf unserer Plattform kannst du Assets erstellen, animieren und hochskalieren – alles in einem übersichtlichen Dashboard.
Midjourney legt den Fokus auf künstlerischen Stil und kreative Verfremdung – perfekt für Animator:innen und Künstler:innen. Google Veo und Sora dagegen setzen eher auf Fotorealismus, Tonabgleich und professionelle Videoproduktion – meist mit höheren Kosten.
Aktuell erstellt das Modell 5-Sekunden-Clips, die sich für längere Videos zusammenfügen lassen. Es gibt Wahlmöglichkeiten für 480p und 720p – ein Kompromiss aus Renderzeit und Bildqualität.
Mit High Motion entstehen zwar intensive Bewegungen, aber auch Bildfehler, „verrutschte“ Frames oder Störungen in der Optik. Am besten nutzt du diese Einstellung für abstrakte Szenen – für detaillierte Figuren ist sie weniger geeignet.
Chaos bringt gezielte Zufälligkeit in Bildgestaltung und Bewegung. Weird sorgt für surreale, experimentelle Effekte. Chaos ist gut für Variation, Weird für kreative Abenteuer.
Ist der Stilwert sehr hoch (über 250), orientiert sich das Modell mehr an seiner eigenen Ästhetik als an deinem Prompt. Stelle ihn auf etwa 100, wenn du eine besonders genaue Umsetzung deines Prompts möchtest.