서비스를 이용하려면 고성능 컴퓨터가 필요한가요?

전혀 그렇지 않습니다. 모든 복잡한 처리는 저희 서버에서 이루어집니다. 웹 브라우저가 있는 기기만 있으면 충분합니다.

제작한 비디오를 비즈니스나 SNS에 사용해도 되나요?

네, 저희 플랫폼에서 생성한 모든 비디오는 사용자의 소유입니다. 마케팅 캠페인, 수익 창출이 가능한 유튜브 채널 및 기타 모든 비즈니스 용도에 적합합니다.

Wan 2.7이 무엇인가요?

Wan 2.7은 2026년 4월에 출시된 알리바바의 최신 오픈 소스 AI 비디오 생성 및 편집 모델입니다. 첫 프레임과 마지막 프레임 제어, 지시어 기반의 비디오 대 비디오 편집, 9그리드 스토리보드 입력, 그리고 더 정확한 구도를 위한 추론 레이어(Thinking Mode)가 특징입니다.

Wan 2.7에서 비디오 편집도 가능한가요?

네, Wan 2.7은 비디오 대 비디오(V2V) 편집을 지원합니다. 기존 비디오 클립을 업로드하고 자연어 텍스트 지시어를 입력하여 원래의 움직임이나 구조를 잃지 않고 스타일, 조명, 환경을 변경할 수 있습니다.

Wan 2.7에서 애니메이션 생성 기능이 개선되었나요?

아니요, Wan 2.7에서 애니메이션 생성 기능은 큰 개선이 이루어지지 않았습니다. 이 모델은 실사 비주얼 스타일에서 가장 우수한 성능을 발휘합니다.

Wan 2.7의 오디오 품질은 Veo 3.1이나 Sora 2와 어떻게 비교되나요?

Wan 2.7은 자체적인 오디오-비주얼 동기화 기능을 잘 유지하고 있으나, 음성의 사실감과 감정의 폭은 여전히 Veo 3.1이나 Sora 2와 같은 프리미엄 폐쇄형 모델에 비해 뒤처지는 편입니다.

Wan

Wan 2.7을 통해 영화 같은 AI 비디오를 제작해 보세요. 첫 프레임과 마지막 프레임 제어, 9그리드 스토리보드 입력, 지능형 추론 및 편집 기능을 모두 제공합니다.

예시

모델

설정

재생 시간

해상도

화면비

Wan이란 무엇인가요?

Wan은 알리바바 그룹(Alibaba Group)의 통이 실험실(Tongyi Lab)에서 개발한 오픈 소스 AI 비디오 생성 모델 시리즈입니다. Wan 시리즈는 알리바바의 멀티모달 AI 기술이 집약된 핵심 프로젝트로, 텍스트 프롬프트, 이미지, 참조 비디오를 사실적인 움직임과 시각적 일관성을 갖춘 고품질 비디오 콘텐츠로 변환하도록 설계되었습니다.

2026년 4월에 출시된 Wan 2.7은 단순 생성 모델을 넘어 더 넓은 범위의 비디오 제작 툴킷으로 크게 확장되었습니다. 프레임 단위의 제어, 지시어 기반 비디오 편집, 그리고 내장된 추론 레이어가 새롭게 추가되었습니다. 광고 컨셉을 구상하는 마케터든, 장면을 시각화하는 영화 제작자든, 이번 버전은 실제 제작 과정에서의 병목 현상을 해결해 줄 실용적인 도구들을 제공합니다. Somake AI의 왼쪽 패널에서 현재 버전과 이전 버전의 Wan 모델을 선택하여 사용해 보실 수 있습니다.

현재 버전: Wan 2.7 (2026년 4월)

요약 정보

속성	상세 정보
모델 버전	Wan 2.7
개발사	알리바바 그룹 — 통이 실험실
출시일	2026년 4월
주요 장점	첫 프레임 및 마지막 프레임 제어, 비디오 대 비디오(V2V) 편집, 연쇄 사고 추론
추천 대상	마케터, 교육자, 독립 영화 제작자, 소셜 미디어 크리에이터

Wan 2.7 — 최신 업데이트 내용

Wan 2.7은 기존의 표준 생성 모델에서 더 포괄적인 비디오 제작 스위트로 Wan 시리즈를 확장시켰습니다. 이번 릴리스에서는 프레임 단위의 정밀 제어, 텍스트 지시어를 통한 기존 영상 편집 기능, 그리고 더욱 정확한 구도를 위한 내부 추론 엔진이 도입되었습니다.

Wan 2.7의 주요 개선 사항:

첫 프레임과 마지막 프레임 생성: 시작 프레임과 끝 프레임을 모두 지정할 수 있습니다. 모델이 두 지점을 논리적으로 연결하는 데 필요한 매끄러운 움직임과 전환을 계산하여 생성합니다.
비디오 대 비디오(Video-to-Video) 편집: 기존 비디오 클립을 업로드하고 자연어 텍스트 지시어를 사용해 원래의 움직임 구조를 유지하면서 스타일, 배경 또는 조명을 수정할 수 있습니다.
9그리드 이미지 대 비디오: 3×3 그리드의 스토리보드 컷들을 하나의 연속적이고 일관된 비디오 내러티브로 변환합니다.
연쇄 사고 추론(Thinking Mode): 내장된 추론 레이어가 프롬프트를 더 정확하게 해석하고, 구도를 강화하며, 12개 언어에 대해 가독성 있는 텍스트를 렌더링합니다.
향상된 피사체 참조: 프레임 전반에 걸쳐 캐릭터와 객체의 정체성을 유지하는 아이덴티티 로킹(Identity locking) 기능이 개선되었습니다. (참고: 일부 고급 멀티 참조 기능은 아직 모든 제3자 플랫폼에서 지원되지 않을 수 있습니다.)

이전 버전 하이라이트 (Wan 2.6):

다음 기능은 Wan 2.6(2025년 12월)에서 도입되었으며 현재 모델에서도 계속 사용 가능합니다:
깨끗한 음성 분리가 포함된 다자간 대화
캐릭터 참조 시스템 (최대 3개 참조) — Somake에서는 아직 미지원
얼굴 및 음성 샘플을 통한 개인 아바타 생성 — Somake에서는 아직 미지원
프롬프트를 통한 배경 및 의상 제어
자체 오디오-비주얼 동기화(Sync) 기능

객관적인 장단점

✅ 장점 (v2.7 기준):

추론 모드(Thinking Mode)를 통해 눈에 띄게 더 정확한 구도와 읽기 쉬운 텍스트 생성
9그리드 스토리보드 입력 기능으로 기획과 제작 워크플로우 연결
오픈 소스 유지로 개발자의 커스텀 배포 유연성 제공
2.5/2.6 버전부터 이어진 안정적인 오디오-비주얼 동기화

⚠️ 한계 (v2.7 기준):

음성의 사실감과 감정 표현은 여전히 Veo 3나 Sora 2와 같은 프리미엄 폐쇄형 모델에 비해 뒤처짐
여러 캐릭터가 등장하는 복잡한 액션 장면에서 시각적 왜곡이 발생할 수 있음
애니메이션 스타일의 비디오 생성 능력이 실사 스타일에 비해 약함 (Wan 2.6 이후 큰 진전 없음)
이전 버전보다 줄었으나 결과물에서 간혹 언어 불일치 현상 발생 가능

주요 활용 사례

마케터 및 소상공인

빠른 소셜 미디어 광고: 인스타그램용 10초 광고 영상이 필요하신가요? "물웅덩이를 가르며 달리는 새로운 스니커즈의 역동적인 샷, 영화 같은 느낌, 고에너지"라고 입력하기만 하면 몇 분 만에 전문가 수준의 광고를 얻을 수 있습니다.
제품 시각화: 상상할 수 있는 모든 설정에서 제품을 보여주는 비디오를 제작해 보세요. "비 내리는 파리의 아늑한 카페 안, 김이 모락모락 나는 책상 위의 커피 머그컵."
비포 & 애프터 시퀀스: 첫 프레임과 마지막 프레임 제어 기능을 사용하여 스킨케어, 리모델링 또는 요리 과정 콘텐츠에 적합한 정밀한 제품 변신 영상을 만들어 보세요.

교육자 및 학생

역사 시각화: 선생님이 "숲 속을 행진하는 로마 병사들의 로우 앵글 샷" 클립을 생성하여 수업의 몰입도를 높일 수 있습니다.
과학 원리 설명: 학생이 "식물 세포 내부를 여행하며 미토콘드리아의 활동을 보여주는 애니메이션"과 같은 영상을 만들어 복잡한 주제를 쉽게 설명할 수 있습니다.

아티스트 및 독립 영화 제작자

빠른 프로토타이핑: 시나리오의 장면을 시각화하여 분위기와 구도가 맞는지 미리 테스트해 보세요. 시간과 비용을 크게 절약할 수 있습니다. 9그리드 스토리보드 입력 기능을 쓰면 더 효율적입니다.
독특한 시각 효과 (VFX): 현실에서 촬영하기 어렵거나 불가능한 초현실적이고 꿈 같은 시퀀스나 추상적인 배경 비주얼을 생성해 보세요.
포스트 프로덕션 스타일 변경: 비디오 대 비디오 편집 기능을 사용하여 실제 편집 작업에 들어가기 전, 기존 영상에 다른 컬러 그레이딩, 조명 조건 또는 환경 변화를 미리 테스트해 볼 수 있습니다.

비교: Wan 2.7 vs 경쟁 모델

기능	Wan 2.7	Veo 3.1	Sora 2
최대 해상도	1080P	4K	1080P
최대 재생 시간	15초	8초	20초
오디오 사실감	기능적이나 약간 기계적임	업계 최고 수준	뛰어나고 자연스러움
오픈 소스 여부	예	아니요	아니요
V2V 편집 지원	예	아니요	아니요
텍스트 렌더링	우수	우수	보통
가격 정책	무료(오픈소스) / 플랫폼별 상이	프리미엄	프리미엄

추천 상황:

Wan 2.7은 오픈 소스의 유연성, 프레임 단위의 제어, 가성비 좋은 비디오 편집 기능이 필요한 사용자에게 가장 강력한 선택입니다.
Veo 3.1은 오디오의 사실감과 해상도 면에서 앞서 있습니다. 예산 제약 없이 음성 품질이 매우 중요할 때 좋은 선택지입니다.
Sora 2는 더 긴 클립과 자연스러운 오디오를 제공하여 긴 호흡의 내러티브 시퀀스에 적합합니다.

Somake AI에서는 플랫폼 이동 없이 Wan 2.7을 Kling, Seedance 같은 다른 모델들과 직접 나란히 비교해 볼 수 있습니다.

Wan 2.7 고급 프롬프트 가이드

멀티샷 스토리텔링 프롬프트 템플릿

영화 같은 [장르] 장면.
샷 1: [와이드/미디엄/클로즈업] 샷, [장면, 캐릭터, 액션 묘사].
샷 2: [카메라 앵글], [화면 전환 및 새로운 초점 묘사].
샷 3: [카메라 앵글], [결말 또는 마지막 순간 묘사].
스타일: [실사/영화같은/스타일화된]. 조명: [자연광/드라마틱한/부드러운].

첫 프레임/마지막 프레임 프롬프트 템플릿

영화 같은 [장르] 장면.
시작 프레임: [시작 구도, 캐릭터, 조명 묘사].
액션/트랜지션: [움직임, 카메라 이동, 상호작용 묘사].
끝 프레임: [최종 목적지 묘사].
스타일: [실사/영화같은/스타일화된]. 텍스트 렌더링: "[화면에 나타날 특정 텍스트를 따옴표 안에 포함]".

프롬프트 확장 기능

입력한 내용이 너무 간단하거나 더 풍부한 시각적 디테일을 원할 때 프롬프트 확장 기능을 활성화하세요. 시스템이 묘사 요소를 추가하여 결과물의 구도, 스타일 일관성, 시각적 조화를 끌어올려 줍니다.

자주 발생하는 문제 해결

문제: 음성이 기계적이거나 부자연스러워요
→ 해결 방법: 이는 Wan 2.7의 성능 한계입니다. 매우 사실적이거나 감정적인 목소리가 필요한 프로젝트라면, 비디오 결과물에 별도로 생성하거나 녹음한 오디오를 합치는 방법을 권장합니다.

문제: 예상치 못한 캐릭터나 초현실적인 요소가 나타나요
→ 해결 방법: Wan 2.7의 추론 모드가 이러한 왜곡을 줄여주지만, 프롬프트에 너무 많은 정보가 담기면 여전히 발생할 수 있습니다. 프롬프트를 단순화하여 다시 생성해 보세요.

문제: 액션 장면에 시각적 왜곡이 생겨요
→ 해결 방법: 여러 캐릭터가 등장하는 복잡한 액션은 모델의 약점입니다. 역동적인 장면을 여러 개의 단순한 샷으로 나누고, 첫/마지막 프레임 기능을 사용해 움직임의 시작과 끝을 명확히 제어해 보세요.

문제: 표지판이나 옷의 글자가 깨져 보여요
→ 해결 방법: Wan 2.7은 추론 모드를 통해 12개 언어의 텍스트 렌더링 성능을 개선했습니다. 여전히 글자가 깨진다면 프롬프트에서 원하는 텍스트를 반드시 따옴표("")로 감싸고, 서로 상충하는 참조 이미지를 섞지 않도록 주의하세요.