Logo

Unlimited WAN 2.2 비디오 생성기: 270억 MoE 시네마틱 AI 모델

Alibaba의 차세대 비디오 생성 모델로, Mixture-of-Experts 아키텍처 기반으로 총 270억 개의 매개변수를 보유하며 단계당 140억 개의 활성 매개변수가 작동해 향상된 시각적 품질을 제공합니다. 개선된 모션 제어, 빨라진 생성 속도, 확장된 학습 데이터를 바탕으로 영화적 비디오 생성 분야에서 획기적인 성능을 구현합니다.

공개
*

Wan 2.2 YouTube 동영상

Wan 2.2의 강력한 AI 비디오 생성 및 긴 비디오 기능을 보여주는 데모와 튜토리얼을 시청하세요

WAN 2.2 X의 인기 리뷰

X (Twitter)에서 WAN 2.2 Animate에 대해 사람들이 무엇을 말하는지 확인하세요

pretty much the end for dancing influencers lol… wan 2.2 animate can not only copy crazy camera moves, but it literally mimics body moves and.. even facial expressions accurately like honestly… can you even tell which one’s the real video?

el.cine
el.cine
@EHuanglu

omg... it's over... Hollywood has officially been left behind you can swap out any actor from any film in one click using Higgsfield’s Wan Replace, it even works with intense camera motion now, anyone can achieve Hollywood level motion control using AI here’s how to do it:

Reply

WAN 2.2란 무엇인가

혁명적인 아키텍처와 영화적 품질을 가진 Alibaba의 획기적인 Mixture-of-Experts 비디오 생성 모델

270억 총계모델 매개변수
140억 활성노이즈 제거 단계당
+65.6%더 많은 훈련 이미지
+83.2%더 많은 훈련 비디오

WAN 2.2는 270억 개의 총 매개변수와 각 노이즈 제거 단계당 140억 개의 활성 매개변수를 가진 혁신적인 Mixture-of-Experts (MoE) 아키텍처를 도입하여 전례 없는 영화적 품질을 달성합니다.

WAN 2.2의 최첨단 고급 기능

Mixture-of-Experts 아키텍처 기반으로 전례 없는 영화적 품질을 구현한 최강 성능의 AI 비디오 생성 모델, WAN 2.2의 혁신 기능을 직접 확인하세요

Mixture-of-Experts 아키텍처

총 270억 개의 매개변수 중 단계당 140억 개만 활성화하는 혁신적인 이중 전문가 시스템으로, 고노이즈와 저노이즈를 담당하는 전문화된 모듈을 활용해 최적의 계산 효율과 한 차원 높은 비디오 품질을 동시에 구현합니다.

대폭 확장된 대용량 훈련 데이터

WAN 2.1 대비 65.6% 더 많은 이미지와 83.2% 더 많은 비디오로 훈련을 완료했으며, 조명, 구도, 색상 보정 정보까지 상세 라벨링된 미적 데이터를 포함해 진정한 영화적 출력을 달성합니다.

향상된 모션 일관성

부드러운 객체 상호작용, 복잡한 신체 움직임, 매끄러운 카메라 움직임으로 탁월한 시간적 일관성을 제공하며, 실제 세계의 물리 법칙과 움직임 역학을 정확하게 시뮬레이션합니다.

다중 해상도 지원

16:9, 9:16, 1:1, 4:3, 3:4를 포함한 구성 가능한 종횡비로 480p와 720p 비디오 생성을 모두 지원하여 다양한 창작 애플리케이션과 플랫폼 요구사항을 충족합니다.

유연한 프레임 제어

8-30 FPS 범위에서 65-257 프레임, 최대 5초 길이의 비디오를 생성할 수 있으며, 다양한 창작 요구에 맞춰 비디오 지속시간과 시간적 역학을 정밀하게 조절할 수 있습니다.

고급 텍스트-비디오 생성

향상된 언어 처리 기술로 상세한 텍스트 프롬프트를 고품질 비디오로 정확하게 변환하며, 복잡한 설명, 액션 시퀀스, 장면 구성에 대한 뛰어난 이해도를 제공합니다.

프리미엄 이미지-비디오 변환

140억 A14B 모델로 정적 이미지를 생동감 넘치는 동적 비디오로 변환하며, 원본의 시각적 일관성을 유지하면서 정지 이미지에 자연스러운 움직임과 시간적 깊이를 더합니다.

소비자 GPU 최적화

NVIDIA RTX 4090 및 유사한 소비자 하드웨어에서 효율적으로 구동되어, 고가의 엔터프라이즈급 장비 없이도 창작자들이 전문가급 비디오 생성 기능을 자유롭게 이용할 수 있습니다.

고품질 영화적 출력

향상된 시각적 충실도, 현실적인 조명, 전문적인 색상 보정, 기존 전통 비디오 제작과 견줄 수 있는 자연스러운 모션 블러로 진정한 영화 품질의 결과물을 만들어냅니다.

지능형 프롬프트 처리

고급 프롬프트 확장과 안전성 검사 기능이 정교한 언어 이해를 바탕으로 사용자의 창의적 의도와 콘텐츠 적절성을 모두 유지하며, 언제나 최적의 결과를 보장합니다.

호출 가능한 작업 시스템

내장된 작업 호출 기능으로 대기 중이거나 처리 중인 비디오 생성 작업을 자유롭게 조회할 수 있어, 끊김 없는 워크플로우 연속성과 효율적인 리소스 관리를 지원합니다.

오픈 소스 접근성

Apache 2.0 라이선스 하에 완전한 모델 가중치와 추론 코드가 모두 제공되어, 연구자와 개발자가 이 기술을 기반으로 자유롭게 혁신적인 애플리케이션을 개발할 수 있습니다.

WAN 2.2 관련 자주 묻는 질문

여기에서 WAN 2.2의 Mixture-of-Experts 아키텍처, 주요 기능, 사용법 등에 대해 가장 많이 궁금해하시는 질문의 답변을 확인하실 수 있습니다

더 궁금한 점이 있으신가요?

WAN 2.2는 총 270억 개의 전체 매개변수를 가지고 있지만 노이즈 제거 단계마다 140억 개의 활성 매개변수만 활용하는 혁신적인 이중 전문가 시스템을 사용합니다. 이 아키텍처에는 고노이즈 구간과 저노이즈 구간에 특화된 별도 전문가 모듈이 포함되어 있어 뛰어난 비디오 품질을 유지하면서 계산 효율성을 극대화할 수 있습니다. 기존의 전통적인 단일 모델 방식과 비교해 더 빠른 추론 속도와 더 나은 최종 결과를 얻을 수 있게 합니다.
WAN 2.2는 최대 5초(65-257프레임) 길이의 비디오를 480p 및 720p 해상도로 생성하며, 구성 가능한 종횡비(16:9, 9:16, 1:1, 4:3, 3:4)를 지원합니다. 8-30 FPS 범위의 프레임 레이트를 지원하며, 텍스트-비디오 변환용 5B 및 14B 매개변수 변형과 영화급 미적 제어를 갖춘 이미지-비디오 변환용 프리미엄 14B 모델을 제공합니다.
WAN 2.2는 영어 프롬프트를 기본으로 사용하며 여러 프롬프트 작성 방식을 지원합니다: 기본형(주체 + 장면 + 동작 구성), 고급형(미적 제어 정보와 스타일 설명 추가), 이미지-비디오 변환용(동작 설명 + 카메라 움직임 중심 구성). 최상의 결과를 위해 '돌리 인', '정적 샷'과 같은 구체적인 영화 용어, 조명 설명, 원하는 스타일 키워드를 활용하는 것을 권장합니다. 모델은 프롬프트당 최대 512토큰까지 지원합니다.
WAN 2.2에는 비디오 생성 과정에서 활성화할 수 있는 내장 안전 검사기와 콘텐츠 필터링 시스템이 기본으로 포함되어 있습니다. 콘텐츠 적절성 검사를 통한 책임감 있는 AI 관행을 따르며, 특정 안전 조치는 사용하시는 사례의 요구사항에 맞춰 구성할 수도 있습니다. 사용자는 Apache 2.0 라이선스 조건 하에서 윤리적인 콘텐츠 생성을 보장할 책임이 있습니다.
WAN 2.2는 세 가지 주요 변형을 제공합니다: 5B 텍스트-비디오(효율적이고 일반 소비자 환경에 적합), A14B 텍스트-비디오(프리미엄 품질, 뛰어난 모션 제어), A14B 이미지-비디오(향상된 시각적 일관성을 제공하는 이미지 애니메이션 전용). A14B 모델은 더 나은 영화적 품질과 모션 충실도를 제공하는 대신 더 많은 계산 리소스를 필요로 합니다.
WAN 2.2는 상당한 계산 리소스를 필요로 하며, A14B 모델의 최적 성능을 위해 80GB 이상의 VRAM을 가진 시스템이 권장됩니다. RTX 4090과 같은 소비자 GPU로도 모델을 실행할 수 있지만 생성 시간이 더 길어집니다. 현재 제한사항으로는 최대 5초 비디오 지속시간, 영어만 지원하는 프롬프트, 최상의 결과를 위해 고품질 입력 프롬프트가 필요하다는 점이 있습니다.

텍스트-비디오 생성을 위한 WAN 2.2 사용법

WAN 2.2의 고급 Mixture-of-Experts 아키텍처와 영화적 제어를 사용하여 텍스트 프롬프트로부터 전문가 품질의 비디오를 만드는 기술을 마스터하세요

1
텍스트 프롬프트 작성
2
비디오 매개변수 구성
3
생성 및 개선

WAN 2.2의 프롬프트 공식을 사용하여 상세한 영어 프롬프트를 작성하세요. 간단한 비디오에는 기본 공식(주체 + 장면 + 동작)을 사용하고, 전문적인 결과에는 고급 공식(주체 설명 + 장면 설명 + 동작 설명 + 미적 제어 + 스타일화)을 사용하세요. 카메라 각도, 조명 조건, 시각적 스타일과 같은 구체적인 영화 용어를 포함하세요.

WAN 2.2 이미지-투-비디오 사용법

WAN 2.2의 고급 이미지-투-비디오 생성 기능을 사용하여 정적 이미지를 영화적 비디오로 변환하는 방법을 학습하세요

1
이미지 업로드
2
모션 설명 작성
3
생성 및 다운로드

애니메이션화하고 싶은 고품질 이미지(JPEG/PNG)를 업로드하세요. 최상의 결과를 위해 이미지는 명확한 피사체와 좋은 구성을 가져야 합니다.

요금

당신에게 맞는 플랜을 선택하세요. 숨겨진 요금이나 예상치 못한 비용은 없습니다.

베이직

AI 여정을 시작하세요

399.99
1년
USD
9000points1개월
우선 지원
얼리 액세스
5 GB(저장 공간)
3(최대 프로젝트 수)
팀 멤버
501개월
오디오 변환
1001개월
API 호출
인기

프로페셔널

AI 경험을 향상시키세요

799.99
1년
USD
27000points1개월
우선 지원
얼리 액세스
20 GB(저장 공간)
10(최대 프로젝트 수)
팀 멤버
1501개월
1501개월
3001개월
API 호출

엔터프라이즈

팀을 위한 강력한 지원

1999.99
1년
USD
75000points1개월
우선 지원
얼리 액세스
100 GB(저장 공간)
50(최대 프로젝트 수)
10(팀 멤버)
6001개월
6001개월
12001개월
100001개월