Wan 2.6 přemění text a obrázky na videa se synchronizací rtů, dialogy více postav a vlastními personami.
Žádná historie nebyla nalezena
Generování selhalo
Wan je open-source řada AI modelů pro generování videí, vyvinutých ve výzkumné laboratoři Tongyi společnosti Alibaba Group. Rodina Wan představuje hlavní multimodální AI projekt Alibaby, navržený pro převod textových zadání, obrázků nebo referenčních videí na kvalitní video obsah s realistickým pohybem a vizuální konzistencí.
Aktuální verze: Wan 2.6 (prosinec 2025)
Naposledy aktualizováno: prosinec 2025
Wan 2.6 dorazil krátce po verzi 2.5 a zaměřuje se na lepší propojení různých médií a větší tvůrčí kontrolu. Tahle verze řeší hlavní nedostatky předchozích generací a přináší nové funkce pro náročnější tvorbu obsahu.
Vylepšená nativní generace zvuku: Kvalita zvuku je výrazně lepší než u Wan 2.5, působí přirozeněji, ale v realistickém podání hlasů pořád zaostává za špičkou jako Veo 3 nebo Sora 2
Delší záběry: Podpora videí do 15 sekund v 1080P, možnost kombinovat klipy pro delší scény
Referenční systém postav: Můžete nahrát až tři video reference postav, aby si jejich vzhled držel konzistenci napříč generacemi (Poznámka: Zatím není dostupné na Somake)
Vytvoření vlastní postavy: Zaznamenejte tvář z více úhlů a hlasové vzorky pro konzistentní AI personu (Poznámka: Zatím není dostupné na Somake)
Dialog více postav: Čisté vedení konverzací mezi několika postavami bez překrývání řeči
Ovládání prostředí a oblečení: Měňte oblečení postav nebo prostředí scény jednoduše pomocí zadání
Plynulý pohyb kamerových záběrů: Výsledná videa obsahují působivé kamerové efekty jako zoom či rozostření, vše s hladkým pohybem
Podoba postav a shoda hlasu mohou být nevyrovnané—tváře a hlasy se někdy liší oproti referenci
Složité akční scény s více postavami (například bojové sekvence) mohou působit vizuálními artefakty nebo zkreslením
Anime styl generovaných videí bývá kvalitativně slabší než realistické provedení
Občas mohou být funkce nestabilní, například jazykový nesoulad ve výstupu
Mohou se objevit nečekané či až surrealistické prvky, což je běžné u dnešních textově-vizuálních AI modelů
Verze | Klíčové schopnosti | Max. délka | Max. rozlišení | Podpora audia |
|---|---|---|---|---|
Wan 2.1 | Text na video, Obrázek na video, Vizuální generování textu | 5 sekund | 720P | Ne |
Wan 2.2 | Vyšší efektivita, VACE integrace, Open-source | 5 sekund | 720P | Ne |
Wan 2.5 | Synchronizace obrazu a zvuku, Vylepšený pohyb | 10 sekund | 1080P | Základní |
Wan 2.6 | Více záběrů v příběhu, Referenční postavy, Vlastní persony | 15 sekund | 1080P | Vylepšené nativní audio/video |
Rychlé reklamy na sociální sítě: Potřebujete poutavé video na Instagram do 10 vteřin? Stačí napsat zadání typu „Dynamický záběr na nové tenisky, jak stříknou do kaluže, filmový styl, energie“, a za pár minut máte profi reklamu.
Produktové vizualizace: Vytvořte video, kde je váš produkt v jakémkoli prostředí, které si představíte. Například: „Nový hrnek na kávu na stole v útulné pařížské kavárně, za deště, s párou.“
Vizuální dějepis: Učitel může generovat klip „Římští vojáci pochodují lesem, pohled zezdola“, a lekce bude mnohem zajímavější.
Vysvětlování vědy: Studenti si mohou vytvořit video ke složitým tématům, třeba „Animovaná cesta rostlinnou buňkou s mitochondriemi v akci.“
Rychlé prototypování: Snadno vizualizujte scénu ze svého scénáře a otestujte atmosféru i kompozici, což ušetří čas i náklady.
Originální vizuální efekty (VFX): Vygenerujte surrealistické, snové sekvence nebo abstraktní pozadí, která by byla těžko nebo vůbec nemožná natočit v reálu.
Šablona zadání pro víc záběrů v příběhu
Filmová [žánr] scéna.
Záběr 1: [Celkový/Polodetail/Detail] záběr, [popište scénu, postavu a akci].
Záběr 2: [Úhel kamery], [popište přechod a nové zaměření].
Záběr 3: [Úhel kamery], [popište rozuzlení nebo závěrečný moment].
Styl: [realistický/filmový/stylizovaný]. Osvětlení: [přirozené/dramatické/měkké].
Doporučení pro referenční postavy
Používejte záběry postav zepředu a s dobrým osvětlením
Nahrávejte referenční videa s více úhly při vytváření vlastní persony
Omezte počet referencí postav na maximálně 3 pro lepší konzistenci
Pro shodu hlasu použijte čisté audio vzorky bez ruchů v pozadí
Připravte se na mírné rozdíly v podobě a hlasu—počítejte s více generacemi
Funguje skvěle: Dialogové scény, mluvící postavy, zaměření na jednu postavu, jednoduché interakce, konverzace více postav
Buďte opatrní: Akce s více postavami, choreografie bojů, rychlé pohyby
Raději se vyhnout nebo počítejte s artefakty: Složitý anime styl, velmi dynamické skupinové scény
Rozšíření zadání doporučujeme, když je vstupní popis jednoduchý nebo chcete bohatší vizuální detaily. Systém doplní popisné prvky pro lepší kompozici, stylovou konzistenci a vizuální soudržnost výsledku.
Problém: Hlas zní roboticky nebo nepřirozeně → Řešení: Jde o aktuální omezení Wan 2.6. Pro projekty vyžadující realistický hlas zvažte použití videa s odděleně generovaným nebo namluveným zvukem.
Problém: Objevují se nečekané postavy nebo surrealistické prvky → Řešení: Artefakty AI jsou u generování text na video běžné. Zjednodušte zadání, snižte počet postav či prvků a vygenerujte znovu. Před použitím výstupy pečlivě zkontrolujte.
Problém: V akčních scénách jsou viditelné vizuální chyby → Řešení: Složité akční sekvence s více postavami jsou slabinou systému. Rozdělte scény na jednodušší, zaměřte se na 1–2 postavy v klipu a vyhněte se choreografii bojů.
Problém: Výstup v anime stylu vypadá nekvalitně → Řešení: Generování anime stylu ve Wan 2.6 je znatelně slabé. Pro anime obsah zvažte jiné modely nebo zadávejte raději realistické styly.
Problém: Vygenerovaný obsah obsahuje jazykové nesrovnalosti → Řešení: Mohou se vyskytnout jazykové chyby. Uveďte jasně preferovaný jazyk přímo do zadání a v případě nesouladu výstup vygenerujte znovu.
Intuitivní rozhraní umožní každému vytvářet profesionální vizuály—stačí popsat, co chcete, a za pár sekund máte hotovo.
Na jednom místě generujete jak obrázky, tak videa, takže celý proces od nápadu až po finální výstup máte pod kontrolou.
Předplatitelé mají plná práva k obchodnímu využití svých výstupů, tedy bez starostí je použijete v reklamách, kampaních nebo klidně pro klienta.
Vůbec ne! O to jde u naší platformy. Veškeré složité zpracování probíhá na našich serverech. Stačí vám jen zařízení a webový prohlížeč.
Ano! Každé video, které u nás vytvoříte, je vaše k libovolnému využití. Perfektně se hodí pro reklamy, obsah na vašem monetizovaném YouTube kanálu nebo jakýkoli byznys účel.
Wan 2.6 je open-source AI model od Alibaby pro generování videí z textu, obrázků nebo referenčních videí. Nabízí příběhy z více záběrů, nativní synchronizaci audia a nástroje pro konzistenci postav, výstupy jsou až 15 sekund v rozlišení 1080P.
Kvalita audia prošla od Wan 2.5 velkým zlepšením a blíží se špičkovým modelům, ale hlas je oproti Veo 3 a Sora 2 stále znatelně robotický.