Logo

Unlimited WAN 2.2 動画生成器:270億パラメータMoEシネマティックAIモデル

Alibabaが開発した次世代動画生成モデルで、Mixture-of-Expertsアーキテクチャを採用し、総パラメータは270億、1ステップあたり140億のアクティブパラメータを持ち、視覚品質を大幅に向上させています。モーション制御の改善、生成速度の高速化、トレーニングデータの拡張により、シネマティック動画生成において画期的なパフォーマンスを達成しています。

公開
*

Wan 2.2 YouTube動画

Wan 2.2の強力なAI動画生成と長尺動画機能を紹介するデモンストレーションとチュートリアルをご覧ください

WAN 2.2 X での人気レビュー

X (Twitter) で WAN 2.2 Animate について何を言っているか見てみましょう

pretty much the end for dancing influencers lol… wan 2.2 animate can not only copy crazy camera moves, but it literally mimics body moves and.. even facial expressions accurately like honestly… can you even tell which one’s the real video?

el.cine
el.cine
@EHuanglu

omg... it's over... Hollywood has officially been left behind you can swap out any actor from any film in one click using Higgsfield’s Wan Replace, it even works with intense camera motion now, anyone can achieve Hollywood level motion control using AI here’s how to do it:

Reply

WAN 2.2とは

革命的なアーキテクチャと映画的品質を持つAlibabaの画期的なMixture-of-Expertsビデオ生成モデル

270億総計モデルパラメータ
140億アクティブノイズ除去ステップあたり
+65.6%訓練画像の増加
+83.2%訓練ビデオの増加

WAN 2.2は270億の総パラメータと各ノイズ除去ステップあたり140億のアクティブパラメータを持つ革命的なMixture-of-Experts(MoE)アーキテクチャを導入し、前例のない映画的品質を実現します。

WAN 2.2の高度な機能

これまでにない映画的品質とMixture-of-Expertsアーキテクチャを特徴とする、最高峰のAIビデオ生成モデルWAN 2.2。その最先端機能の数々をご確認ください

Mixture-of-Expertsアーキテクチャ

総パラメータ270億、1ステップあたり140億のアクティブパラメータを搭載する革新的なデュアルエキスパートシステムです。高ノイズ・低ノイズそれぞれに特化した専門モジュールを活用し、最適な計算効率とトップクラスのビデオ品質を両立しています。

大規模に拡張された訓練データ

旧バージョンのWAN 2.1と比較し、65.6%多い画像データと83.2%多いビデオデータで訓練を実施しています。照明、構図、カラーグレーディング別に詳細なラベルが付与された美的データも含まれ、本格的な映画風出力を実現します。

強化されたモーション一貫性

オブジェクト同士の滑らかな相互作用、複雑な身体の動き、流れるようなカメラワークまで、驚異的な時間的一貫性を提供します。現実世界の物理学と動的特性を正確に再現することが可能です。

マルチ解析度サポート

16:9、9:16、1:1、4:3、3:4を含む設定可能なアスペクト比で480pと720pの両方のビデオ生成をサポートし、多様なクリエイティブアプリケーションとプラットフォーム要件に対応します。

柔軟なフレーム制御

8~30FPSの範囲で65~257フレーム(最大5秒)のビデオ生成に対応し、あらゆるクリエイティブニーズに合わせてビデオの持続時間と時間的ダイナミクスを精密に制御できます。

高度なテキスト-ビデオ生成

強化された言語処理機能により、詳細なテキストプロンプトを高品質なビデオに変換します。複雑な説明、一連のアクション、シーン構成まで、優れた理解度で正確に再現します。

プレミアム画像-ビデオ変換

140億A14Bモデルの性能で静止画像を動的なビデオに変換し、視覚的な一貫性を維持しながら元の静止画にリアルな動きと時間的深度を追加することができます。

コンシューマーGPU最適化

NVIDIA RTX 4090をはじめとする一般向けコンシューマーハードウェア上で効率的に動作するよう最適化されており、エンタープライズ級の機器がなくてもクリエイターがプロフェッショナル品質のビデオ生成を利用できます。

高品質映画的出力

強化された視覚的忠実性、リアルな照明、プロ仕様のカラーグレーディング、従来のビデオ制作に匹敵する自然なモーションブラーによって、本格的な映画品質のビデオを生成します。

インテリジェントプロンプト処理

高度なプロンプト拡張と安全性チェック機能を搭載し、洗練された言語理解を通じて、コンテンツの適切性とクリエイターの意図を両立しながら常に最適な結果を保証します。

呼び出し可能タスクシステム

標準で搭載されたタスク呼び出し機能により、保留中または処理中のビデオ生成ジョブを後から取得でき、シームレスなワークフローの継続と効率的なリソース管理を実現します。

オープンソースアクセシビリティ

Apache 2.0ライセンスの下で完全なモデル重みと推論コードが公開されており、研究者や開発者がこの技術をベースに革新的なアプリケーションを開発することを可能にしています。

WAN 2.2に関するよくある質問

WAN 2.2のMixture-of-Expertsアーキテクチャ、機能、使い方に寄せられる代表的な疑問への回答をこちらでご確認いただけます

他にご質問は?

WAN 2.2は総パラメータ数270億を持ちながら、ノイズ除去ステップ1回あたりでは140億のアクティブパラメータのみを使用する革新的なデュアルエキスパートシステムを導入しています。高ノイズ段階と低ノイズ段階それぞれに専門化されたエキスパートを配置することで、高品質なビデオ出力を維持しつつ計算効率を最適化しており、従来の単一モデルによるアプローチと比較して高速な推論とより優れた出力結果を両立できます。
WAN 2.2は最大5秒(65-257フレーム)のビデオを480pと720pの解像度で生成し、設定可能なアスペクト比(16:9、9:16、1:1、4:3、3:4)をサポートします。8-30 FPSのフレームレートに対応し、テキスト-ビデオ生成用に5Bと14Bのパラメータバリアントを用意しているほか、映画グレードの美的制御を備えた画像-ビデオ変換用のプレミアム14Bモデルも提供しています。
WAN 2.2では英語のプロンプトを使用し、複数のプロンプト形式に対応しています。基本形は「主体+シーン+動き」、上級者向けではこれに美的制御とスタイリゼーション指定を追加、画像-ビデオ生成の場合は「動作説明+カメラ動き」を含める形が推奨です。最良の結果を得るためには「ドリーイン」「静止ショット」といった具体的な映画用語、照明の描写、スタイルを指定するキーワードを活用してください。モデルはプロンプトあたり最大512トークンまで対応しています。
WAN 2.2には、生成処理中に有効化可能な組み込みの安全チェッカーとコンテンツフィルタリングシステムが搭載されています。モデル自体はコンテンツの適切性チェックを組み込んだ責任あるAI実践に準拠していますが、利用ケースの要件に応じて個別に安全対策を調整することも可能です。Apache 2.0ライセンスの条項の下で、倫理的なコンテンツ生成を行う責任は利用者にあります。
WAN 2.2は3つの主要バリアントを提供しています:5Bテキスト-ビデオ(高効率で消費者向け)、A14Bテキスト-ビデオ(プレミアム品質で優れたモーション制御を実現)、A14B画像-ビデオ(画像のアニメーション化専用で視覚的一貫性が強化されている)。A14Bモデルはより高い映画品質とモーションの忠実性を提供する一方で、より多くの計算リソースを必要とします。
WAN 2.2は相当な計算リソースを必要とし、A14Bモデルでは最適なパフォーマンスを得るために80GB以上のVRAMを搭載したシステムが推奨されています。RTX 4090のような一般消費者向けGPUでも実行自体は可能ですが、生成時間が長くなります。現在判明している制限としては、最大ビデオ持続時間が5秒であること、プロンプトは英語のみサポートしていること、高品質な結果を得るために高品質な入力プロンプトが必要になることが挙げられます。

WAN 2.2をテキスト-ビデオ生成に使用する方法

WAN 2.2の高度なMixture-of-Expertsアーキテクチャと映画的制御を使用して、テキストプロンプトからプロ品質のビデオを作成する技術をマスターしてください

1
テキストプロンプトを作成
2
ビデオパラメータを設定
3
生成と改良

WAN 2.2のプロンプト公式を使用して詳細な英語プロンプトを書いてください。シンプルなビデオには基本公式(主体+シーン+動き)を使用し、プロフェッショナルな結果には上級公式(主体説明+シーン説明+動き説明+美的制御+スタイル化)を使用してください。カメラアングル、照明条件、視覚的スタイルなどの具体的な映画用語を含めてください。

WAN 2.2 画像から動画の使い方

WAN 2.2の高度な画像から動画生成機能を使用して、静止画を映画的な動画に変換する方法を学びます

1
画像をアップロード
2
モーション記述を書く
3
生成とダウンロード

アニメーション化したい高品質な画像(JPEG/PNG)をアップロードします。最良の結果を得るには、画像に明確な被写体と良い構図が必要です。

料金

あなたに合ったプランを選んでください。隠れた料金や予期せぬ費用はありません。

ベーシック

AIの旅を始めましょう

399.99
1年
USD
9000points1ヶ月
優先サポート
先行アクセス
5 GB(ストレージ容量)
3(最大プロジェクト数)
チームメンバー
501ヶ月
音声文字起こし
1001ヶ月
API呼び出し
人気

プロフェッショナル

AIエクスペリエンスを向上させる

799.99
1年
USD
27000points1ヶ月
優先サポート
先行アクセス
20 GB(ストレージ容量)
10(最大プロジェクト数)
チームメンバー
1501ヶ月
1501ヶ月
3001ヶ月
API呼び出し

エンタープライズ

チームに強力なサポートを提供

1999.99
1年
USD
75000points1ヶ月
優先サポート
先行アクセス
100 GB(ストレージ容量)
50(最大プロジェクト数)
10(チームメンバー)
6001ヶ月
6001ヶ月
12001ヶ月
100001ヶ月