اكتشف قوة Midjourney لإنشاء فيديوهات صامتة. دليل شامل لتحويل فنك إلى حركة، ومقارنة بين Sora و Midjourney، وأكثر.
لم يتم العثور على سجل سابق
في عالم الفيديوهات التوليدية الذي يزداد ازدحامًا بسرعة، حيث تتنافس شركات ضخمة مثل Sora من OpenAI وVeo من Google نحو تحقيق الواقعية العالية والاعتمادية التجارية، اتخذت Midjourney مسارًا مختلفًا وأكثر دقة ربما. هدفها ليس استبدال طاقم التصوير بعد؛ بل هي تحاول تحريك اللوحة الفنية.
فيما يلي الشرح التقني حول كيفية إتقان هذا الأداة، ومدى جدواها الاقتصادية مقارنة بالمنافسين، وأين يمكن أن تضيف قيمة لأفكارك الإبداعية.
جوهر نسخة فيديو Midjourney الحالية هو محرك تحويل الصور إلى فيديو. يأخذ صورة ثابتة منشأة أو مرفوعة، ويحولها إلى مقطع متحرك مدته 5 ثوانٍ.
على عكس Veo أو Sora، اللتين تركزان غالبًا على الاتساق الزمني لسرد القصص، فإن Midjourney تضع الملمس، والإضاءة، والعمق في المقدمة. هي تعامل الفيديو كما لو أنه لوحة متحركة.
المدة: حلقات بمدة 5 ثواني (يمكن تمديدها عبر الدمج).
الصوت: لا يوجد. الناتج صامت تماماً. هي أداة بصرية وليست مخرجًا صوتيًا بصريًا.
هذا يعني أن الأداة ليست مصممة للحوارات أو الحركات المعقدة، بل للقطات السينمائية، أو فيديوهات المزاج، أو الفن المفهومي المتحرك.
حركة منخفضة: هذا هو الخيار الآمن. يعمل بشكل رائع مع البورتريه، صور المنتجات، أو المعمارية التفصيلية. ينتج عنه حركة هادئة مثل جزيئات غبارٍ تتطاير، شعر يتمايل، أو تغييرات خفيفة في الإضاءة.
حركة عالية: حركات كاميرا درامية وحركة قوية للعنصر الرئيسي.
كلما زادت قيمة الجودة، زادت دقة الملمس وحسابات الإضاءة، لكن ذلك يؤدي إلى زيادة ملحوظة في وقت التصيير (واستهلاك دقائق وحدة المعالجة الرسومية).
هذا هو شريط التحكم الأساسي بجمالية الفيديو. يحدد مدى التزام النموذج بـ"معايير الجمال" الخاصة بـMidjourney مقابل تفاصيل الطلب الذي تكتبه.
قيم منخفضة (50–150): تحكم أكبر في الطلب، وجمالية أقل اتساقًا.
الاستخدام: الأفكار الهجينة أو تصميم الكائنات الخاصة (مثل "قطة-تنين"). إذا كنت تحتاج أن يلتزم النموذج بالتفاصيل التشريحية، أبقِ قيمة الاستايل منخفضة.
قيم مرتفعة (250–750): جمالية متماسكة وعناية أقل بتفاصيل الطلب.
الاستخدام: عندما تريد "طابع Midjourney" — مظهر سلس ومرسوم وجذاب، حتى لو تجاهل بعض تفاصيل الطلب.
العشوائية: تتحكم في تنوع الشبكة المبدئية. في الفيديوهات، هذا يعني مدى تغير التكوين أثناء توليد الصورة الأساسية.
الغَرَابة: تضيف لمسات تجريبية وسريالية. استخدمها بحذر ما لم تكن تبحث عن أسلوب فني الحلم أو الرعب التجريدي.
للجمال: --stylize 300 --chaos 0 --weird 0 (حركة عالية للمشاهد الطبيعية)
للدقة: --stylize 100 --chaos 0 --weird 0 (حركة منخفضة للشخصيات)
Midjourney تقدم أداءً منافساً بشكل مفاجئ، حيث تعتبر الخيار الاقتصادي للتجارب عالية الدقة.
الدقة: 720p؛ المدة: 4-5 ثوان:
Sora 2: تقريباً 80 نقطة/فيديو
Sora 2 Pro: تقريباً 240 نقطة/فيديو
Veo 3.1 السريع (الصوت مغلق): تقريباً 80 نقطة/فيديو
Veo 3.1 (الصوت مغلق): تقريباً 160 نقطة/فيديو
Midjourney: تقريباً 100 نقطة
لتحقيق النزاهة، يجب الإشارة إلى نقاط ضعف النموذج.
عدم وجود هيكل عظمي للشخصيات: النموذج يتعامل مع البكسلات وليس التشريح. لا يدرك أن الكوع يتحرك في اتجاه واحد فقط. بعض الحركات المعقدة (كالقتال أو الرقص) غالبًا ما تؤدي إلى ظهور عيوب جسدية مخيفة.
الصمت: غياب توليد الصوت يتطلب منك إتقان برامج المونتاج للحصول على منتج نهائي متكامل.
يركز Midjourney على الأسلوب الفني والتجريد الإبداعي، مما يجعله خيارًا مثاليًا للمصممين والفنانين. أما Google Veo وSora فتركيزهما الأساسي على الواقعية العالية، وتزامن الصوت، والإنتاج التجاري للفيديوهات، غالبًا بكلفة أعلى.
حاليًا، النموذج ينتج مقاطع مدتها 5 ثوانٍ. يمكن دمجها للحصول على مدة أطول. خيارات الدقة تشمل 480p و720p، لتحقيق توازن بين سرعة التصيير وجودة الصورة.
عند استخدام الحركة العالية، قد تظهر عيوب بصرية، إطارات غير متناسقة، أو فقدان للانسجام العام. يُنصح باستخدامها في المشاهد التجريدية وليس لوحات الشخصيات التفصيلية.
العشوائية تضيف لمسة تغيير محسوبة على التكوين والحركة، بينما الغرابة تزودك بتأثيرات سريالية وتجريبية. استخدم العشوائية للتنوع، والغرابة للاستكشاف الفني الإبداعي.
عند ضبط قيمة الاستايل على مستوى عالي (أعلى من 250)، فإن النموذج يفضل اللمسة الجمالية الخاصة به على تفاصيل طلبك. خفض هذه القيمة إلى حوالي 100 للحصول على التزام أفضل بما كتبت.