Logo

Unlimited Wan 2.5 비디오 & 이미지 생성기 - 오디오 동기화 지원 멀티모달 AI

Alibaba의 고급 멀티모달 AI 생성 모델로 텍스트-비디오, 이미지-비디오, 텍스트-이미지 생성을 모두 지원합니다. 고품질 1080p 출력, 동기화된 오디오 합성, 5-10초의 유연한 지속 시간 옵션, 다양한 창작 작업을 위한 포괄적인 다국어 프롬프트 지원을 제공합니다.

공개
*

WAN 2.5 YouTube 동영상

WAN 2.5의 강력한 비디오 생성 기능을 보여주는 커뮤니티 데모와 리뷰를 시청하세요

Wan 2.5 X의 인기 리뷰

X (Twitter)에서 Wan 2.5에 대해 사람들이 무엇을 말하는지 확인하세요

Wan 2.5란 무엇인가

강력한 텍스트-투-비디오, 이미지-투-비디오, 텍스트-투-이미지 기능을 갖춘 Alibaba의 고급 멀티모달 AI 생성 모델

3가지 형식텍스트/이미지-비디오 & 텍스트-이미지
1080p최대 해상도
5-10초비디오 지속 시간
다국어프롬프트 이해

Wan 2.5는 텍스트-투-비디오, 이미지-투-비디오, 텍스트-투-이미지 형식에 걸쳐 다양한 콘텐츠 생성을 제공하는 최첨단 멀티모달 AI 모델입니다.

Wan 2.5의 강력한 핵심 기능

이미지와 비디오 생성 분야에서 Wan 2.5를 압도적으로 만드는 차세대 고급 멀티모달 기능을 직접 확인해보세요

멀티모달 생성

하나의 통합 모델로 텍스트-비디오, 이미지-비디오, 텍스트-이미지 생성까지 모두 지원해 여러 미디어 유형을 넘나드는 원활한 창작 워크플로우를 완성할 수 있습니다.

고해상도 출력

최대 1080p 해상도의 비디오 생성이 가능하며 480p와 720p 옵션도 함께 제공해 다양한 사용 환경에서 전문가 수준의 시각 콘텐츠를 제작할 수 있습니다.

유연한 지속 시간 제어

5초부터 10초까지 원하는 길이로 비디오 지속 시간을 자유롭게 맞춤 설정할 수 있어 다양한 콘텐츠 기획과 창작 요구에 유연하게 대응할 수 있습니다.

오디오 동기화

원패스 오디오-비디오 동기화 기능으로 원하는 커스텀 오디오를 쉽게 통합할 수 있으며 캐릭터 애니메이션을 위한 자동 립싱크 기능도 기본으로 지원합니다.

다중 종횡비

모든 해상도에서 가로(16:9) 및 세로(9:16) 형식을 모두 지원하여 소셜 미디어, 프레젠테이션을 비롯한 다양한 디스플레이 환경에 완벽하게 맞춤 제작할 수 있습니다.

다국어 프롬프트

내장 번역 지원으로 여러 언어로 작성된 프롬프트를 그대로 처리할 수 있어 전 세계의 모든 창작자가 언어 장벽 없이 모델을 자유롭게 이용할 수 있습니다.

프롬프트 확장

사용자가 입력한 설명을 자동으로 개선하고 보강하여 더욱 풍부하고 디테일한 생성 결과를 얻을 수 있게 돕는 고급 프롬프트 최적화 기능입니다.

네거티브 프롬프팅

출력에 포함되길 원하지 않는 요소를 직접 지정해 결과물을 정교하게 다듬을 수 있으며 최종 생성물의 품질과 내용에 대한 정밀한 제어가 가능합니다.

시드 제어

맞춤형 시드 값으로 동일한 결과물을 재현할 수 있어 일관된 품질을 유지하며 창작 결과를 반복적으로 개선해나갈 수 있습니다.

빠른 생성 모드

텍스트-비디오와 이미지-비디오 작업에 최적화된 고속 변환으로, 품질을 유지하면서 처리 시간을 대폭 단축시킬 수 있습니다.

커스텀 이미지 크기

텍스트-이미지 생성은 256×256에서 1536×1536 픽셀까지 유연한 크기 조정을 지원하며 여러 사전 설정 종횡비와 커스텀 크기 옵션을 제공합니다.

고급 아키텍처

움직임, 물리학, 시각적 일관성에 대한 정교한 이해를 바탕으로, Alibaba의 최첨단 비디오 생성 기술을 기반으로 구축되었습니다.

Wan 2.5에 관한 자주 묻는 질문

더 궁금한 점이 있으신가요?

알리바바의 고급 멀티모달 AI 생성 모델인 Wan 2.5는 텍스트-투-비디오, 이미지-투-비디오, 텍스트-투-이미지 생성의 세 가지 핵심 기능을 지원합니다. 하나의 작업만 처리하는 단일 목적 모델과 달리 여러 콘텐츠 형식을 자유롭게 다룰 수 있으며, 1080p 고해상도 지원, 5~10초 사이의 유연한 비디오 지속 시간, 오디오 동기화 기능까지 갖춘 다재다능함이 가장 큰 특징입니다.
Wan 2.5는 가로(16:9) 및 세로(9:16) 방향 모두에서 480p(832×480), 720p(1280×720), 1080p(1920×1080)를 포함한 여러 비디오 해상도를 지원합니다. 비디오 지속 시간은 5초와 10초 중 자유롭게 선택할 수 있어, 크리에이터가 본인 프로젝트의 특정 요구 사항에 맞춰 고를 수 있습니다.
Wan 2.5는 비디오 생성 과정에 사용자가 준비한 맞춤 오디오 URL을 통합할 수 있는 고급 오디오 동기화 기능을 탑재하고 있습니다. 모델이 입력된 오디오를 생성되는 비디오 콘텐츠에 자동으로 정렬하여 소리와 영상이 일치하는 동기화된 멀티미디어 결과물을 만들어냅니다. 사용 가능한 오디오는 최대 50MB 크기의 MP3, WAV 또는 M4A 형식 파일입니다.
Wan 2.5는 세 가지 주요 생성 모드를 지원합니다: 텍스트-투-비디오는 텍스트 프롬프트를 바탕으로 사용자가 원하는 해상도와 지속 시간의 동적 비디오를 생성하고, 이미지-투-비디오는 정적 이미지를 움직이는 애니메이션 비디오로 변환해줍니다. 텍스트-투-이미지는 256×256에서 1536×1536 픽셀까지 유연한 종횡비를 지원해 뛰어난 예술적 표현력의 고품질 이미지를 만들어냅니다.
예, Wan 2.5는 다국어 프롬프트 이해를 기본 지원합니다. 모델 내부에는 최적의 생성 결과를 얻기 위해 입력 프롬프트를 자동으로 영어로 변환해주는 내장 번역 옵션이 포함되어 있습니다. 또한 더 나은 결과물을 위해 입력 프롬프트를 보완 향상시켜주는 프롬프트 확장 기능도 갖추고 있어 전 세계 크리에이터 모두가 쉽게 접근할 수 있습니다.
Wan 2.5는 비디오 생성 시 선택할 수 있는 두 가지 속도 옵션을 제공합니다. 표준 모드는 출력 품질과 처리 시간 사이의 균형을 맞춘 옵션이며, 고속 모드는 생성 속도를 높여 빠른 프로토타이핑이나 반복적인 워크플로우 작업에 이상적입니다. 두 모드 모두 동일한 해상도와 지속 시간 옵션을 사용하며, 고품질 출력을 유지한다는 점은 같습니다.
Wan 2.5의 텍스트-투-이미지 모드는 1:1(1024×1024), 3:4, 4:3, 16:9 형식을 포함한 여러 종횡비를 지원하며 최대 1536×1536 픽셀의 고해상도 이미지 생성 옵션을 제공합니다. 뛰어난 프롬프트 이해력과 예술적 표현력을 자랑하며, 원치 않는 요소를 배제하기 위한 네거티브 프롬프트를 지원하고, 256에서 1536 픽셀까지 64 픽셀 단위로 조정 가능한 맞춤 비율 제어 기능도 갖추고 있습니다.
물론입니다! Wan 2.5는 지원되는 모든 해상도에서 가로(16:9) 및 세로(9:16) 종횡비를 모두 지원합니다. 이 유연성 덕분에 기존 와이드스크린 콘텐츠부터 TikTok과 Instagram Reels 같은 소셜 미디어 플랫폼용 모바일 최적화 세로 비디오까지, 모든 플랫폼과 사용 사례에 완벽하게 맞는 콘텐츠를 만들 수 있습니다.

요금

당신에게 맞는 플랜을 선택하세요. 숨겨진 요금이나 예상치 못한 비용은 없습니다.

베이직

AI 여정을 시작하세요

399.99
1년
USD
9000points1개월
우선 지원
얼리 액세스
5 GB(저장 공간)
3(최대 프로젝트 수)
팀 멤버
501개월
오디오 변환
1001개월
API 호출
인기

프로페셔널

AI 경험을 향상시키세요

799.99
1년
USD
27000points1개월
우선 지원
얼리 액세스
20 GB(저장 공간)
10(최대 프로젝트 수)
팀 멤버
1501개월
1501개월
3001개월
API 호출

엔터프라이즈

팀을 위한 강력한 지원

1999.99
1년
USD
75000points1개월
우선 지원
얼리 액세스
100 GB(저장 공간)
50(최대 프로젝트 수)
10(팀 멤버)
6001개월
6001개월
12001개월
100001개월