Logo

高效能通義千問影像AI生成器

這是阿里巴巴推出的革命性200億參數多模態擴散變壓器,具備業界頂尖的文本渲染能力。不論是字母文字還是表意文字,都能出色完成複雜多行文本整合任務,支援專業影像編輯、風格轉換與對象操作。這款模型採用Apache 2.0許可證,中文文本渲染效果極佳,還支援包含對象檢測與語義分割在內的多項先進計算機視覺任務。

公開
*

Qwen Image YouTube 影片

觀看社區演示和教學,了解 Qwen Image 模型的 AI 影像生成和編輯能力

Qwen Image 在 X 上的熱門評價

看看大家在 X (Twitter) 上對 Qwen Image 的評價

Now you can easily create training data for @Alibaba_Qwen Qwen-Image-Edit-2509 in Lorata, and export dataset to @ostrisai's AI Toolkit for training! Everything runs on your local machine👀 Btw, the target image here is also generated using Qwen Image Edit, pretty nice quality✨

Radionic
Radionic
@Radionic0

Just open-sourced Lorata, a new data labeling tool for the GenAI era. You can now easily prepare training data for the text-to-image, image-editing models, and more!✨ An image editor with drawing and cropping tools is also built-in!

Reply

什麼是通義千問影像

阿里巴巴前沿的影像生成AI,具備革命性的文本渲染技術

阿里巴巴技術驅動
200億參數規模
多語言卓越性能
Apache 2.0開源

通義千問影像是200億參數的多模態擴散變壓器,為影像內文本集成設立新標準,在字母文字與表意文字的多行文本渲染方面表現卓越。

通義千問影像的全方位強大功能

一起認識讓通義千問影像在AI影像生成領域脫穎而出的各項頂尖功能

先進的文本渲染

能精準處理字母與表意文字的複雜多行文本渲染,就連中文字元也能在影像中正確生成

200億參數模型

搭載200億參數的多模態擴散變壓器,以強大運算能力帶來絕佳的影像質量與細節表現

多風格支援

可生成各種不同藝術風格的影像,從逼真相片、抽象藝術、動漫到數碼插畫都能輕鬆實現

靈活的解析度

支援從256x256到2048x2048像素的自訂影像尺寸,能完美符合任何使用場景的需求

快速模式

啟用後可加速生成流程,適合快速迭代創意、製作構想的快速原型

提示詞翻譯

內建翻譯功能,自動將提示詞轉換為英文以取得最佳生成效果,完美支援全球用戶

提示詞最佳化

透過智慧增強提示內容提升生成品質,確保您的創意願景能精準落地實現

可調引導強度

可在1到20之間微調引導強度,自由控制影像和提示詞的匹配程度

可變步數控制

可在10到50之間自訂推理步數,幫你在影像質量和生成速度之間找到完美平衡

種子可重現性

透過固定種子值取得一致可重現的生成結果,對需要反覆迭代的設計工作至關重要

Apache 2.0許可證

是採用寬鬆Apache 2.0許可證的開源模型,無論個人還是商業使用都合適

基於積分的定價

擁有高效的積分定價系統,依解析度動態調整價格,每張圖片生成僅需5積分起

通義千問影像相關常見問題

這裡整理了關於通義千問影像AI模型與其各項功能的常見問題解答

還有其他問題嗎?

通義千問影像以出色的文字渲染能力脫穎而出,尤其擅長處理複雜多行文字與中文字元。做為一款具備200億參數的多模態擴散變壓器,它能高精度地將文字直接融入生成影像中,這是多數其他模型難以達成的成果。它同時支援多種藝術風格,並採用Apache 2.0開源許可證釋出。
通義千問影像支援從256x256像素到2048x2048像素的彈性自定義解析度,並以64像素做為調整增量。預設解析度為1024x1024,但你可以獨立調整寬度與高度,創建任何縱橫比的影像來符合需求,不論是正方形、寬版風景或是高版人像都可以。
當然可以!通義千問影像內建翻譯支援,會自動將提示詞轉換為英文來取得最佳生成成果,讓全球各地不論母語為何的使用者都能順利操作。這款模型也在生成影像的中文文字渲染上具備特殊優勢,非常適合多語言內容創作。
通義千問影像採用動態的基於積分的定價系統,單張圖片的基礎成本為5積分,最終價格會依據你選擇的解析度調整。解析度越高因為需要更多運算資源,因此會消耗更多積分,舉例來說,生成2048x2048解析度的影像成本就高於1024x1024解析度的影像。
快速模式是經過速度最佳化的功能,能實現更快的影像生成,適合快速迭代構想與原型製作。當你正在測試不同的提示詞或是需要快速取得成果時,這個功能特別實用。雖然生成品質可能些微下降,但它能大幅加快流程,非常適合腦力激盪會議或是需要快速取得多種變體的時候使用。
是的,通義千問影像採用Apache 2.0許可證發布,這是一項非常寬鬆的授權,同時開放個人與商業使用。你可以將生成的影像用於商業目的、行銷素材、產品設計等用途,不需要支付額外的授權費用。這種開源模式讓新創公司、企業與個人創作者都能輕鬆運用。

如何使用通義千問影像進行文本生成影像

掌握通義千問影像先進文本渲染能力的專業影像生成技巧

1
精心製作詳細提示詞
2
配置生成設定
3
生成和最佳化您的影像

用任何語言編寫描述性提示詞 - 通義千問影像在簡單和複雜描述方面都表現出色。包含關於風格、構圖、光照以及希望在影像中渲染的任何文本的具體細節。模型內置的翻譯功能確保無論您的輸入語言如何都能獲得最佳結果。

Qwen-Image 圖生圖功能使用指南

善用 Qwen-Image 的高級能力,輕鬆掌握圖生圖變換

1
準備基礎影像
2
編寫詳細提示詞
3
調整強度參數
4
最佳化結果

先準備一張清晰、高品質的基礎影像,Qwen-Image 擅長在完整保留原構圖的前提下,依據詳細提示詞變換風格元素,效果相當出色。

價格

選擇適合您的方案。沒有隱藏費用,沒有意外。

Basic

Start your AI journey

399.99
1 年
USD
9000points1 月
Priority Support
Early Access
5 GB(Storage Space)
3(Maximum Projects)
Team Members
50 images1 月
Audio Transcription
100 snippets1 月
API Calls
熱門

Professional

Elevate your AI experience

799.99
1 年
USD
27000points1 月
Priority Support
Early Access
20 GB(Storage Space)
10(Maximum Projects)
Team Members
150 images1 月
150 minutes1 月
300 snippets1 月
API Calls

Enterprise

Powerful support for your team

1999.99
1 年
USD
75000points1 月
Priority Support
Early Access
100 GB(Storage Space)
50(Maximum Projects)
10(Team Members)
600 images1 月
600 minutes1 月
1200 snippets1 月
10000 calls1 月