ค้นพบพลังการสร้างวิดีโอไร้เสียงจาก Midjourney คู่มือเปลี่ยนภาพศิลปะให้เคลื่อนไหว พร้อมเปรียบเทียบ Sora vs. Midjourney และอีกมากมาย
ไม่พบประวัติ
ในยุคที่เครื่องมือสร้างวิดีโอกำลังได้รับความนิยมอย่างรวดเร็ว และมีบริษัทยักษ์ใหญ่อย่าง Sora ของ OpenAI และ Veo ของ Google ที่แข่งขันกันเรื่องเรียลลิสม์และความพร้อมใช้งานเชิงธุรกิจ Midjourney ได้เลือกแนวทางที่ต่างออกไป ดูเหมือนจะเจาะลึกด้านความซับซ้อนมากกว่า พวกเขายังไม่หวังจะมาแทนทีมถ่ายหนัง—แต่กำลังเปลี่ยนผืนผ้าใบให้เคลื่อนไหวแทน
นี่คือสรุปเทคนิคสำหรับการใช้งานเครื่องมือนี้ วิธีการประเมินความคุ้มค่าเมื่อเทียบกับคู่แข่ง และตำแหน่งของ Midjourney ในชุดเครื่องมือสำหรับคนสร้างสรรค์
หลักๆ วิดีโอ Midjourney เวอร์ชันปัจจุบันเป็นระบบ Image-to-Video ที่รับภาพนิ่ง—จะสร้างหรืออัปโหลดเองก็ได้—และเปลี่ยนให้กลายเป็นคลิปอนิเมชั่น 5 วินาที
ต่างจาก Veo หรือ Sora ซึ่งเน้นความต่อเนื่องทางเวลาเพื่อเล่าเรื่อง Midjourney เน้น ความละเอียดพื้นผิว, แสง, และความลึก มากกว่า วิดีโอที่สร้างจะเหมือนภาพวาดที่ถูกทำให้เคลื่อนไหว
ระยะเวลา: วนลูป 5 วินาที (สามารถนำไปต่อกันให้ยาวขึ้นได้)
เสียง: ไม่มี! ผลลัพธ์คือวิดีโอแบบไม่มีเสียง เหมาะกับงานภาพ ไม่ใช่ผู้กำกับภาพและเสียง
ดังนั้น เครื่องมือนี้จึงไม่ได้ถูกออกแบบมาสำหรับฉากบทสนทนาหรือการจัดวางซับซ้อน แต่เหมาะกับงานภาพยนตร์ แนวฟีลลิ่ง หรืออนิเมชั่นคอนเซ็ปต์อาร์ต
Low Motion: ปลอดภัยสุด เหมาะกับ ภาพคน, ภาพสินค้า หรือสถาปัตยกรรมละเอียดๆ จะสร้างความเคลื่อนไหวเล็กๆ เช่น ฝุ่นลอย ผมหรือสิ่งของขยับเบาๆ และเปลี่ยนแสงแบบละมุน
High Motion: เคลื่อนกล้องแรงๆ หรือวัตถุในภาพขยับเร็ว เหมาะกับฉากใหญ่หรือบรรยากาศดราม่า
หากตั้งค่าคุณภาพสูงขึ้น จะได้รายละเอียดพื้นผิวและการคำนวนแสงสวยขึ้น แต่จะใช้เวลาสร้างและทรัพยากร GPU เพิ่มมากขึ้น
เป็นค่าสำคัญสำหรับควบคุมสไตล์ภาพ จะกำหนดว่าโมเดลจะยึดตาม “มาตรฐานความงาม” ของ Midjourney หรือยึดตามโจทย์ของคุณแค่ไหน
ค่าต่ำ (50–150): ควบคุมผลลัพธ์ตามโจทย์ได้สูง แต่ความกลมกลืนของภาพอาจต่ำลง
ตัวอย่างการใช้: แนวผสม หรือออกแบบคาแรกเตอร์เฉพาะ เช่น “Cat-Dragon” หากต้องการอวัยวะยังต้องตรงกับโจทย์ให้ตั้งค่าต่ำ
ค่าสูง (250–750): ได้ภาพกลมกลืน สวยแน่นอน แต่รายละเอียดตามโจทย์อาจลดลง
ตัวอย่างการใช้: อยากได้ลุค Midjourney เรียบเนียน ดูเหมือนภาพวาดสวยๆ ถึงแม้จะไม่ตรงโจทย์ทุกจุด
Chaos: ควบคุมความหลากหลายของรูปแบบเริ่มต้น ในวิดีโอคือจะทำให้องค์ประกอบภาพเปลี่ยนได้มากขึ้นระหว่างสร้างพื้นฐาน
Weird: ใส่ความทดลอง แปลกตา และเหนือจริง (Surreal) ลงไป ใช้เท่านี้ถ้าต้องการความฝัน หรือแนวสยองขวัญแบบแอบแปลก
ลุคสวย: --stylize 300 --chaos 0 --weird 0 (High Motion เหมาะกับวิวหรือแลนด์สเคป)
เป๊ะตรงโจทย์: --stylize 100 --chaos 0 --weird 0 (Low Motion สำหรับตัวละครหรือคาแรกเตอร์)
Midjourney ถือว่าแข่งได้ แถมยังเป็นตัวเลือกที่ประหยัดงบในการทดลองงานภาพละเอียดสูง
ความละเอียด: 720p; ระยะเวลา: 4-5 วินาที:
Sora 2: ~80 เครดิต/วิดีโอ
Sora 2 Pro : ~240 เครดิต/วิดีโอ
Veo 3.1 Fast (ปิดเสียง): ~80 เครดิต/วิดีโอ
Veo 3.1 (ปิดเสียง): ~160 เครดิต/วิดีโอ
Midjourney: ~100 เครดิต
เพื่อความเป็นกลาง ต้องพูดถึงจุดอ่อนที่โมเดลยังติดขัดอยู่
ไม่มีโครงกระดูก: โมเดลสร้างจากพิกเซล ไม่ใช่กายวิภาค ฉะนั้นมันไม่รู้ว่าแขนข้อศอกงอได้ทางเดียว ฉากที่เคลื่อนไหวซับซ้อน เช่น ต่อสู้หรือเต้นรำมักจะออกมาแปลกๆ
ไม่มีเสียง: การที่สร้างเสียงไม่ได้ ทำให้งานสุดท้ายต้องมีทักษะตัดต่อเพิ่มเติมถึงจะสมบูรณ์
Midjourney เน้นสไตล์ศิลปะและการสร้างสรรค์ภาพ ทำให้เหมาะกับนักอนิเมชั่นและศิลปิน ส่วน Google Veo กับ Sora จะเน้นความสมจริงระดับภาพถ่าย การซิงค์เสียง และการสร้างวิดีโอธุรกิจ ซึ่งมักมีราคาสูงกว่า
ตอนนี้ตัวโมเดลจะสร้างคลิปยาว 5 วินาที สามารถนำไปต่อกันให้ยาวขึ้นได้ ความละเอียดเลือกได้ทั้ง 480p และ 720p เพื่อความสมดุลระหว่างความเร็วกับคุณภาพภาพ
การตั้งค่า High Motion จะให้ภาพเคลื่อนไหวแบบแรงและตื่นตา แต่ก็อาจเกิดภาพแปลก เฟรมเบี้ยว หรือรายละเอียดหลุด ควรใช้กับฉากแนวทดลองหรือนามธรรม ไม่แนะนำกับภาพคนหรือคาแรกเตอร์ละเอียดๆ
Chaos เพิ่มความสุ่มแบบควบคุมทั้งองค์ประกอบและความเคลื่อนไหว ส่วน weird จะทำให้ภาพดูทดลอง แนวเหนือจริง ใช้ chaos เพื่อปรับความหลากหลาย ใช้ weird ถ้าอยากทดลองสร้างแนวใหม่ๆ
ถ้าตั้งค่า stylize สูงมาก (เกิน 250) โมเดลจะเน้นสไตล์ของตัวเองมากกว่าโจทย์ที่กำหนด หากอยากให้ผลลัพธ์ตรงกับข้อความ ให้ลดค่านี้เหลือประมาณ 100