Logo

Grok Imagine

Aurora AIを搭載するGrok Imagineは、xAIが開発した革新的なテキスト・トゥ・ビデオ生成モデルで、シンプルなテキストプロンプトを入力するだけで同期音声付きの6秒ビデオを生成できます。高度な自己回帰mixture-of-expertsアーキテクチャを基盤としており、卓越した視覚詳細レンダリングを提供し、創造的なビデオ生成のためのマルチモーダル入力に対応しています。

公開
*

Grok Imagine YouTube動画

Grok Imagine AIの機能を紹介するデモンストレーションとチュートリアルをご覧ください

Grok Imagine X での人気レビュー

X (Twitter) で Grok Imagine について何を言っているか見てみましょう

Both JSON and natural language work for Grok Imagine. And remember to keep updating your @Grok app, as we release improvements every few days!

Dreams of Mars 🕊❤️🚀🌕
Dreams of Mars 🕊❤️🚀🌕
@MemesOfMars

Why so complicated? @Grok knows human language and doesn’t render JSON: so it removes all brackets, quotes, colons before rendering. What Grok actually sees: ——— Hyper-realistic cinematic portrait in 8K resolution, Photography (DSLR) with 85mm f/1.4 lens, sharp focus on face

Image
Reply

Grok Imagine とは

Aurora の mixture-of-experts アーキテクチャによって駆動される革命的な AI ビデオ生成

xAI Aurora駆動技術
6秒動画出力
同期音声機能
マルチモーダル入力

Grok Imagine は xAI の Aurora 技術によって駆動され、高度な自己回帰 mixture-of-experts ネットワークを使用して簡単なテキストプロンプトから同期音声付きの素晴らしい6秒ビデオを作成します。

Grok Imagineが誇る強力な機能

動画生成の可能性を押し広げ、Grok Imagineのクオリティを圧倒的に高める先進の機能の数々をご確認ください

Aurora AI アーキテクチャ

数十億もの学習例で訓練されたAurora独自の自己回帰mixture-of-expertsネットワークを基盤とし、卓越した視覚理解力と正確なテキスト指示追従性を両立しています。

同期オーディオ生成

映像と完璧に同期したオーディオ付きの6秒動画を作成でき、ポストプロダクションでのオーディオ編集の手間を削減し、ワンランク上の視聴体験を実現します。

6秒動画作成

SNS、広告、クイック視覚ストーリーテリングなどの用途に最適な、魅力的な6秒動画クリップの作成に特化して最適化されています。

マルチモーダル入力サポート

テキストプロンプトと画像入力の両方に対応し、純粋なテキスト記述による生成から画像をガイドにした動画作成まで、多様なクリエイティブワークフローを可能にします。

高品質視覚レンダリング

細部まで正確なフォトリアリスティックなレンダリングを提供し、商用利用から芸術制作まで幅広い用途に適したプロフェッショナルグレードの動画を生成します。

高度なプロンプト理解

テキストプロンプトで最大4,000文字まで対応し、複雑な記述や創造的な指示を的確に読み解いて反映します。

プロンプト最適化ツール

より高品質な動画生成結果を得るため、入力されたテキスト記述を自動的に改善する内蔵のプロンプト強化機能です。

多言語サポート

複数言語でのプロンプト入力に対応し、最適なモデル性能とグローバルなアクセシビリティを実現するため自動で英語に翻訳します。

実世界エンティティ認識

実世界のエンティティ、テキスト、ロゴを正確な視覚詳細でレンダリングし、正確な視覚表現が求められるリアルな肖像作成にも優れた性能を発揮します。

瞬時動画生成

高速な処理能力により動画をすばやく提供し、効率的なクリエイティブワークフローと反復的なコンテンツ開発を可能にします。

創造的柔軟性

マーケティングコンテンツから芸術的表現まで多様なクリエイティブ用途に対応し、様々な動画スタイルやテーマ全体で一貫した高品質を提供します。

プロフェッショナル統合

信頼性の高いAPIアクセスと一貫した出力品質により、商用アプリケーションのプロフェッショナルなワークフローにシームレスに統合できます。

よくある質問

Grok Imagine と Aurora AI 技術に関するよくあるご質問

他にご質問は?

Grok Imagine は、インターネット上の数十億の例でトレーニングされた Aurora AI の自己回帰 mixture-of-experts ネットワークによって駆動されています。このアーキテクチャはフォトリアルなレンダリング、正確なテキスト指示の追従に優れ、マルチモーダル入力をネイティブサポートしており、動画生成時にユーザーが提供した画像からインスピレーションを得たり、直接編集したりすることが可能です。
Grok Imagine は同期オーディオ付きの6秒動画クリップを作成します。モデルはこの長さに特化して最適化されているため、ソーシャルメディアコンテンツ、短い広告、短い視覚的ストーリーテリングに最適です。同期オーディオは動画作成プロセスの一環として自動的に生成されます。
Grok Imagine は複数言語でのプロンプトを受け入れ、最適なモデル性能を得るために自動的に英語に翻訳されます。お好みの言語で最大4,000文字までプロンプトを記述でき、システムはあなたの創造的な意図を保持したまま翻訳を処理します。
はい、Grok Imagine はマルチモーダル入力をサポートしており、テキストプロンプトと画像の両方を受け入れます。動画生成のために純粋なテキスト記述を提供することも、テキストと画像を組み合わせて動画作成プロセスをガイドすることもできます。この柔軟性により、コンセプトから最終動画まで多様な創造的ワークフローが可能です。
Grok Imagine で動画を生成するには、リクエストごとに200クレジットが必要です。各リクエストでは同期オーディオ付きの6秒動画が1つ生成されます。モデルは最適な品質と処理効率を確保するため、リクエストごとに1つの動画だけを生成します。
Grok Imagine は現在、同期オーディオ付きの6秒動画生成に最適化されています。モデルはフォトリアルなレンダリングと正確な指示追従に優れていますが、動画の長さは6秒に固定されています。モデルは英語のプロンプトで最高の性能を発揮しますが、自動翻訳により複数言語を受け入れることができます。

Grok Imagine を使ったテキストからビデオ生成する方法ガイド

Grok Imagine の Aurora AI テクノロジーを活用して、同期音声付きの魅力的な6秒ビデオを作成する方法を学びましょう

1
テキストプロンプトを作成する
2
生成設定を構成する
3
ビデオを生成してレビューする

あなたが希望するビデオコンテンツの詳細なテキスト説明を記入してください。Grok Imagine は最大4,000文字のプロンプトに対応し、最適なパフォーマンスのために複数言語を自動で英語に翻訳します。

料金

あなたに合ったプランを選んでください。隠れた料金や予期せぬ費用はありません。

ベーシック

AIの旅を始めましょう

399.99
1年
USD
9000points1ヶ月
優先サポート
先行アクセス
5 GB(ストレージ容量)
3(最大プロジェクト数)
チームメンバー
501ヶ月
音声文字起こし
1001ヶ月
API呼び出し
人気

プロフェッショナル

AIエクスペリエンスを向上させる

799.99
1年
USD
27000points1ヶ月
優先サポート
先行アクセス
20 GB(ストレージ容量)
10(最大プロジェクト数)
チームメンバー
1501ヶ月
1501ヶ月
3001ヶ月
API呼び出し

エンタープライズ

チームに強力なサポートを提供

1999.99
1年
USD
75000points1ヶ月
優先サポート
先行アクセス
100 GB(ストレージ容量)
50(最大プロジェクト数)
10(チームメンバー)
6001ヶ月
6001ヶ月
12001ヶ月
100001ヶ月