Wan 2.5 (preview) API nodes are now live in ComfyUI! A big leap forward for image & video generation 🎵 Audio-Visual Sync (voices, ASMR, music, effects) 🎬 10s Videos (richer storytelling) ✨ 1080P cinematic quality 🔊 Audio conditioning as input Examples 👇
無限萬象2.5 影片圖像生成器 - 支援音訊同步的多模態AI
阿里巴巴研發的先進多模態AI生成模型,支援文生影片、圖生影片與文生圖,提供高質量1080p輸出、同步音訊合成,可彈性調整生成時長為5到10秒,並完整支援多語言提示詞,適合各類多元的創意應用需求。
萬象 2.5 YouTube 影片
觀看社區演示和評測,了解萬象 2.5 的強大影片生成能力
Wan 2.5 在 X 上的熱門評價
看看大家在 X (Twitter) 上對 Wan 2.5 的評價
Wan 2.5 / Kling 2.5 Turbo ... Esto no se detiene. Ya da un poco de miedo. El pangolín espectacular. Que opinas de mi caracol hecho con Kling 2.5 Turbo?
💥🤯 the new Wan 2.5 and it is insane now it has audio, sound effects and... voices! check these amazing examples below🧵
Wan 2.5 is so interesting. It solves the inverse problem of audio to video. In essence, it uses audio + prompt to infer video. This means you can design your audio track to tell a story which can be very efficient. Here I did a quick mock up first with drawing, then I fed in an Show more
With creative WAN product placement style that feel catchy + meme-worthy + launch-ready With @higgsfield_ai WAN 2.5 is here a fundamental update where every feature is powered by WAN. #HiggsfieldWAN
🚨 WAKE UP!! WAN 2.5 SPEAKS!🚨 You read that right, just released tonight, Wan 2.5 has native audio just like VEO3! Capable of 1080p and 10 seconds and Image To Video at launch. Text To Video Prompt: camera natural light, 8K. cinematic realistic dramatic zoom in on a a Show more
Wan 2.5 vs Kling 2.5 - the difference of physics is massive! 😱
Wan 2.5 Hits Real Off! I'm quite impressed how fluid the camera movement and sound design is. And of course with unlimited generation on Higgsfield AI I'm more than happy to experiment 🧩 Show more
什麼是 Wan 2.5
阿里巴巴先進的多模態AI生成模型,具有強大的文本生成影片、圖片生成影片與文本生成圖片能力
Wan 2.5 是前沿的多模態AI模型,能夠跨文本生成影片、圖片生成影片與文本生成圖片格式提供多樣化的內容生成。
什麼是 Wan 2.5
阿里巴巴先進的多模態AI生成模型,具有強大的文本生成影片、圖片生成影片與文本生成圖片能力
Wan 2.5 是前沿的多模態AI模型,能夠跨文本生成影片、圖片生成影片與文本生成圖片格式提供多樣化的內容生成。
萬象 2.5 領先業界的強大功能
一起認識讓萬象 2.5 在影片與影像生成領域脫穎而出的先進多模態技術
多模態生成
單一整合模型就涵蓋文生影片、圖生影片和文生圖需求,實現跨媒體類型無縫接軌的創意工作流程
高解析度輸出
可輸出最高1080p解析度的影片,同時提供480p和720p彈性選項,為各種應用場景帶來專業級品質的視覺內容
靈活時長控制
可打造自訂時長的影片,範圍從5秒到10秒自由調整,完美對應不同內容規劃與創意構想的彈性需求
音訊同步
內建一次性完成的音影片同步功能,支援自定義音訊整合,還具備角色動畫自動唇形同步的實用能力
多種寬高比
在所有解析度下都支援橫向(16:9)和縱向(9:16)格式,完美適配社交媒體、演示文稿和各種顯示場景
多語言提示詞
可處理多種語言的輸入提示詞,內建翻譯支援,能滿足全球各地創作者與多元受眾的使用需求
提示詞擴展
搭載先進的提示詞最佳化功能,自動強化用戶輸入的描述,幫助你獲得更豐富、細節更完整的生成結果
負面提示詞
讓你透過指定不需要出現的元素最佳化輸出,精準控制最終成品的內容與整體品質
種子控制
可透過自定義種子值獲得可重現的生成結果,方便維持輸出一致性,也利於創意作品的迭代最佳化
快速生成模式
專為文生影片和圖生影片任務最佳化的快速變體,能大幅縮短整體處理時間,同時維持同等水準的輸出品質
自定義圖片尺寸
文生圖支援從256×256到1536×1536像素的靈活尺寸設定,提供多個預設寬高比與自定義尺寸選項
先進架構
建構在阿里巴巴前沿的影片生成技術之上,對於運動、物理規則與視覺連貫性有極深刻的掌握
Wan 2.5 常見問答集
還有其他問題嗎?
