Q3는 오디오를 자동으로 생성하나요?

네, 그렇습니다. 영상 생성 과정에서 대사, 효과음, 배경음악이 함께 제작됩니다. 별도의 오디오 작업이 필요하지 않습니다.

어떤 언어를 지원하나요?

현재 대사 및 영상 내 텍스트 렌더링을 위해 한국어, 중국어, 영어, 일본어를 지원합니다.

Q2와 Q3의 차이점은 무엇인가요?

Q2는 다중 참조 이미지의 일관성에 집중한 모델입니다. 반면 Q3는 연장된 영상 길이, 자체 오디오 생성, 스마트 컷 편집, 그리고 텍스트 렌더링 기능이 추가되었습니다.

Q3로 액션 장면을 만들 수 있나요?

네, 가능합니다. Q3는 복잡한 물리 법칙이 적용되는 액션이나 여러 피사체 간의 상호작용을 매우 안정적으로 구현해냅니다.

Q3가 애니메이션 제작에도 적합한가요?

매우 훌륭합니다. Vidu는 2D 작화 일관성과 부드러운 애니메이션 연출로 정평이 나 있습니다.

Vidu

Vidu Q3로 대사, 효과음, 배경음이 동기화된 16초 AI 영상을 만들어보세요. 스마트 컷 편집, 1080p 고해상도 출력 및 다국어 지원까지 완벽하게 제공합니다.

예시

Vidu AI 생성기

Vidu는 Shengshu Technology와 칭화 대학교가 공동 개발한 AI 동영상 생성 모델 시리즈입니다.

비주얼 생성과 오디오 후반 작업을 별도로 진행해야 했던 이전 버전(Vidu 1.0 및 1.5)과 달리, Vidu Q3는 모든 과정을 하나로 합친 '올인원' 생성 엔진입니다.

현재 버전: Vidu Q3

Vidu Q3의 핵심 기능

자체 오디오-비디오 합성

대사, 효과음, 배경음악이 동기화된 최대 16초 분량의 영상을 한 번에 생성합니다. 별도의 오디오 후반 작업이 전혀 필요 없습니다.

멀티숏 스토리텔링

Vidu Q3는 서사에 맞춰 카메라 시점과 장소를 자동으로 전환합니다. 대화 장면의 경우, 풀샷으로 시작해 결정적인 순간에 클로즈업으로 전환한 뒤 다시 미디엄 샷으로 돌아오는 연출을 단 하나의 프롬프트로 완성할 수 있습니다.

시네마틱 카메라 인텔리전스

이 모델은 전문가 수준의 카메라 언어를 이해합니다. 푸시인, 팬, 트래킹 샷, 오빗 앵글, 돌리 줌 등을 구사하여 모든 프레임이 의도적으로 연출된 듯한 느낌을 줍니다.

Vidu Q3 활용 사례

숏폼 내러티브: 16초의 길이와 '스마트 컷' 기능을 활용해 완벽한 호흡의 미니 스토리를 제작할 수 있습니다.
제품 홍보 영상: 배경음악과 효과음이 통합되어 있어 즉시 게시 가능한 수준의 상업 광고를 만들 수 있습니다.
애니메이션 및 스타일라이즈드 그래픽: 업계 최고 수준의 2D 일관성과 부드러운 캐릭터 움직임을 제공합니다.
글로벌 캠페인: 자체 오디오 생성 및 립싱크 지원으로 현지화 작업이 매우 간편해집니다.
게임 개발 및 피칭 자료: 참조 이미지 지원을 통해 프로토타입 트레일러의 비주얼 정체성을 일관되게 유지할 수 있습니다.

프롬프트 가이드

프롬프트를 영화 촬영 지시서처럼 구성해 보세요:

[대상] + [행동] + [배경] + [카메라] + [오디오]

작성 예시:

빨간 코트를 입은 젊은 여성이 밤에 비에 젖은 도쿄 골목길을 걷고 있다.
젖은 노면에 네온사인 불빛이 반사된다. 그녀는 잠시 멈춰 서서 하늘을 보며 미소 짓는다.
카메라: 와이드 트래킹 샷, 이후 얼굴 클로즈업으로 컷 전환.
오디오: 빗소리 앰비언스, 멀리서 들리는 교통 소음, 잔잔한 피아노 배경음악.
대사 (영어): 그녀가 "드디어 집에 왔네."라고 속삭인다.

숙련자를 위한 팁

카메라 언어 활용: "돌리 줌", "로우 앵글 트래킹", "360도 오빗"과 같은 용어를 사용해 보세요.
오디오 지시어: [SFX: 유리창 깨지는 소리] 또는 [BGM: 긴장감 넘치는 오케스트라] 등을 포함하세요.
스마트 컷 제어: 장면의 호흡을 직접 묘사하거나 "컷 없이 연속된 싱글 테이크(continuous single take)"라고 명시하세요.
텍스트 렌더링: 화면에 표시될 텍스트는 5단어 이하로 유지하고, 프롬프트에 정확한 문구를 기재하세요.
다국어 설정: 최상의 립싱크 결과를 위해 언어와 감정 톤을 지정하세요.