Wan 2.5 (preview) API nodes are now live in ComfyUI! A big leap forward for image & video generation 🎵 Audio-Visual Sync (voices, ASMR, music, effects) 🎬 10s Videos (richer storytelling) ✨ 1080P cinematic quality 🔊 Audio conditioning as input Examples 👇
无限万象2.5 视频图像生成器 - 支持音频同步的多模态AI
阿里巴巴推出的先进多模态AI生成模型,支持文生视频、图生视频和文生图生成任务,输出1080p高质量内容,自带同步音频合成功能,可灵活选择5-10秒生成时长,同时完整支持多语言提示词,适配各类多样化创意应用场景。
万象 2.5 YouTube 视频
观看社区演示和评测,了解万象 2.5 的强大视频生成能力
Wan 2.5 在 X 上的热门评价
看看大家在 X (Twitter) 上对 Wan 2.5 的评价
Wan 2.5 / Kling 2.5 Turbo ... Esto no se detiene. Ya da un poco de miedo. El pangolín espectacular. Que opinas de mi caracol hecho con Kling 2.5 Turbo?
💥🤯 the new Wan 2.5 and it is insane now it has audio, sound effects and... voices! check these amazing examples below🧵
Wan 2.5 is so interesting. It solves the inverse problem of audio to video. In essence, it uses audio + prompt to infer video. This means you can design your audio track to tell a story which can be very efficient. Here I did a quick mock up first with drawing, then I fed in an Show more
With creative WAN product placement style that feel catchy + meme-worthy + launch-ready With @higgsfield_ai WAN 2.5 is here a fundamental update where every feature is powered by WAN. #HiggsfieldWAN
🚨 WAKE UP!! WAN 2.5 SPEAKS!🚨 You read that right, just released tonight, Wan 2.5 has native audio just like VEO3! Capable of 1080p and 10 seconds and Image To Video at launch. Text To Video Prompt: camera natural light, 8K. cinematic realistic dramatic zoom in on a a Show more
Wan 2.5 vs Kling 2.5 - the difference of physics is massive! 😱
Wan 2.5 Hits Real Off! I'm quite impressed how fluid the camera movement and sound design is. And of course with unlimited generation on Higgsfield AI I'm more than happy to experiment 🧩 Show more
什么是 Wan 2.5
阿里巴巴先进的多模态AI生成模型,具有强大的文本生成视频、图片生成视频和文本生成图片能力
Wan 2.5 是前沿的多模态AI模型,能够跨文本生成视频、图片生成视频和文本生成图片格式提供多样化的内容生成。
什么是 Wan 2.5
阿里巴巴先进的多模态AI生成模型,具有强大的文本生成视频、图片生成视频和文本生成图片能力
Wan 2.5 是前沿的多模态AI模型,能够跨文本生成视频、图片生成视频和文本生成图片格式提供多样化的内容生成。
万象 2.5 的强大核心功能
一起来领略万象 2.5 领先的多模态实力,看它如何在图像与视频生成领域脱颖而出
多模态生成
单一一统模型就支持文生视频、图生视频和文生图多种任务,打通不同媒体类型的创意流程,实现全程无缝衔接
高解析度输出
最高可生成1080p解析度的视频,同时提供480p和720p选项,产出满足各类场景需求的专业级视觉内容
灵活时长控制
支持自定义视频时长,范围从5秒到10秒任意调整,灵活匹配不同内容场景与各类创意需求
音频同步
自带一次性音视频同步能力,支持自定义音频集成,还能自动完成角色动画的唇形同步匹配
多种宽高比
所有解析度下都支持横向(16:9)和纵向(9:16)格式,完美适配社交媒体、演示文稿和各类显示场景
多语言提示词
可处理多种语言的输入提示词,内置翻译支持,能够轻松服务来自全球的创作者和多元化受众
提示词扩展
搭载先进的提示词优化功能,自动丰富细化你的输入描述,帮你得到细节更饱满、内容更完整的生成结果
负面提示词
你可以指定不需要生成的元素来优化输出,精准控制最终成品的内容方向与质量表现
种子控制
支持自定义种子值获得可复现的生成结果,方便保持输出一致性,对创意内容进行迭代优化
快速生成模式
专为文生视频和图生视频任务优化的快速版本,大幅缩短处理时长的同时,依旧保持不输标准模式的生成质量
自定义图片尺寸
文生图支援从256×256到1536×1536像素的灵活尺寸设置,自带多个预设宽高比,同时支持自定义尺寸选项
先进架构
依托阿里巴巴前沿的视频生成技术打造,对运动规律、物理规则和视觉连贯性拥有出色的理解能力
Wan 2.5 常见问题解答
还有其他问题?
