Open source models are crazy. Alibaba just dropped Wan 2.2 Animate, a new model that can animate any character based on a simple souce image. It handles facial expressions and body movements like no other model. 10 insane examples: (sound on)
Unlimited WAN 2.2 動画生成器:270億パラメータMoEシネマティックAIモデル
Alibabaが開発した次世代動画生成モデルで、Mixture-of-Expertsアーキテクチャを採用し、総パラメータは270億、1ステップあたり140億のアクティブパラメータを持ち、視覚品質を大幅に向上させています。モーション制御の改善、生成速度の高速化、トレーニングデータの拡張により、シネマティック動画生成において画期的なパフォーマンスを達成しています。
Wan 2.2 YouTube動画
Wan 2.2の強力なAI動画生成と長尺動画機能を紹介するデモンストレーションとチュートリアルをご覧ください
WAN 2.2 X での人気レビュー
X (Twitter) で WAN 2.2 Animate について何を言っているか見てみましょう
Wan 2.2 Animate is CRAZY and it actually excels at 3 things from my tests: 1. Lip syncing (so far the best open source I have seen, beating Runway Act2) 2. Consistent lighting & shadows with color tone replication when you swap a character 3. It keeps the replacement character Show more
Wan 2.2 Animate Lip syncing Test. Definitely way better than Runway Act2 in my opinion. Takes about 8 minutes for a HD video to be processed at 720p vertical (reels style)
You've probably seen viral character swaps from Wan 2.2 Animate. But now you can swap the character AND background using a reference video + new image. I turned myself into a YouTuber in Paris. How it works 👇
New tool to swap characters in a video: Wan 2.2 Animate Spent a few hours testing it out this weekend and have some thoughts on strengths + weaknesses. It's particularly strong at videos like this where you need to replicate lip sync and body movement. Other tips ⬇️
Wan 2.2 Animate is actually Crazy!! You can replace characters from a simple source image. No need to first frame anymore. It handles facial expressions and body movements like no other model I have ever seen. It is open source and free to use, that's the crazy part!
pretty much the end for dancing influencers lol… wan 2.2 animate can not only copy crazy camera moves, but it literally mimics body moves and.. even facial expressions accurately like honestly… can you even tell which one’s the real video?
omg... it's over... Hollywood has officially been left behind you can swap out any actor from any film in one click using Higgsfield’s Wan Replace, it even works with intense camera motion now, anyone can achieve Hollywood level motion control using AI here’s how to do it:
Just tried Wan2.2-Animate... and HOLY SMOKES, it's PERFECT! 🤯 @Alibaba_Wan
What used to take hours in After Effects now takes just ONE prompt. Nano Banana, Seedream 4, Wan 2.2, Runway Aleph et al are pioneering instruction-based editing -- collapsing complex VFX pipelines into a single, implicit step. Here's everything you need to know in 10 mins: Show more
WAN 2.2とは
革命的なアーキテクチャと映画的品質を持つAlibabaの画期的なMixture-of-Expertsビデオ生成モデル
WAN 2.2は270億の総パラメータと各ノイズ除去ステップあたり140億のアクティブパラメータを持つ革命的なMixture-of-Experts(MoE)アーキテクチャを導入し、前例のない映画的品質を実現します。
WAN 2.2とは
革命的なアーキテクチャと映画的品質を持つAlibabaの画期的なMixture-of-Expertsビデオ生成モデル
WAN 2.2は270億の総パラメータと各ノイズ除去ステップあたり140億のアクティブパラメータを持つ革命的なMixture-of-Experts(MoE)アーキテクチャを導入し、前例のない映画的品質を実現します。
WAN 2.2の高度な機能
これまでにない映画的品質とMixture-of-Expertsアーキテクチャを特徴とする、最高峰のAIビデオ生成モデルWAN 2.2。その最先端機能の数々をご確認ください
Mixture-of-Expertsアーキテクチャ
総パラメータ270億、1ステップあたり140億のアクティブパラメータを搭載する革新的なデュアルエキスパートシステムです。高ノイズ・低ノイズそれぞれに特化した専門モジュールを活用し、最適な計算効率とトップクラスのビデオ品質を両立しています。
大規模に拡張された訓練データ
旧バージョンのWAN 2.1と比較し、65.6%多い画像データと83.2%多いビデオデータで訓練を実施しています。照明、構図、カラーグレーディング別に詳細なラベルが付与された美的データも含まれ、本格的な映画風出力を実現します。
強化されたモーション一貫性
オブジェクト同士の滑らかな相互作用、複雑な身体の動き、流れるようなカメラワークまで、驚異的な時間的一貫性を提供します。現実世界の物理学と動的特性を正確に再現することが可能です。
マルチ解析度サポート
16:9、9:16、1:1、4:3、3:4を含む設定可能なアスペクト比で480pと720pの両方のビデオ生成をサポートし、多様なクリエイティブアプリケーションとプラットフォーム要件に対応します。
柔軟なフレーム制御
8~30FPSの範囲で65~257フレーム(最大5秒)のビデオ生成に対応し、あらゆるクリエイティブニーズに合わせてビデオの持続時間と時間的ダイナミクスを精密に制御できます。
高度なテキスト-ビデオ生成
強化された言語処理機能により、詳細なテキストプロンプトを高品質なビデオに変換します。複雑な説明、一連のアクション、シーン構成まで、優れた理解度で正確に再現します。
プレミアム画像-ビデオ変換
140億A14Bモデルの性能で静止画像を動的なビデオに変換し、視覚的な一貫性を維持しながら元の静止画にリアルな動きと時間的深度を追加することができます。
コンシューマーGPU最適化
NVIDIA RTX 4090をはじめとする一般向けコンシューマーハードウェア上で効率的に動作するよう最適化されており、エンタープライズ級の機器がなくてもクリエイターがプロフェッショナル品質のビデオ生成を利用できます。
高品質映画的出力
強化された視覚的忠実性、リアルな照明、プロ仕様のカラーグレーディング、従来のビデオ制作に匹敵する自然なモーションブラーによって、本格的な映画品質のビデオを生成します。
インテリジェントプロンプト処理
高度なプロンプト拡張と安全性チェック機能を搭載し、洗練された言語理解を通じて、コンテンツの適切性とクリエイターの意図を両立しながら常に最適な結果を保証します。
呼び出し可能タスクシステム
標準で搭載されたタスク呼び出し機能により、保留中または処理中のビデオ生成ジョブを後から取得でき、シームレスなワークフローの継続と効率的なリソース管理を実現します。
オープンソースアクセシビリティ
Apache 2.0ライセンスの下で完全なモデル重みと推論コードが公開されており、研究者や開発者がこの技術をベースに革新的なアプリケーションを開発することを可能にしています。
WAN 2.2に関するよくある質問
WAN 2.2のMixture-of-Expertsアーキテクチャ、機能、使い方に寄せられる代表的な疑問への回答をこちらでご確認いただけます
他にご質問は?
WAN 2.2をテキスト-ビデオ生成に使用する方法
WAN 2.2の高度なMixture-of-Expertsアーキテクチャと映画的制御を使用して、テキストプロンプトからプロ品質のビデオを作成する技術をマスターしてください
WAN 2.2のプロンプト公式を使用して詳細な英語プロンプトを書いてください。シンプルなビデオには基本公式(主体+シーン+動き)を使用し、プロフェッショナルな結果には上級公式(主体説明+シーン説明+動き説明+美的制御+スタイル化)を使用してください。カメラアングル、照明条件、視覚的スタイルなどの具体的な映画用語を含めてください。
WAN 2.2 画像から動画の使い方
WAN 2.2の高度な画像から動画生成機能を使用して、静止画を映画的な動画に変換する方法を学びます
アニメーション化したい高品質な画像(JPEG/PNG)をアップロードします。最良の結果を得るには、画像に明確な被写体と良い構図が必要です。