Logo

高效能通義千問影像AI生成器

呢款係阿里巴巴推出的革命性200億參數多模態擴散變壓器,具備業界頂尖的文本渲染能力。唔論係字母文字定表意文字,都能出色處理複雜多行文本整合,支援專業影像編輯、風格轉換同對象操作。模型採用Apache 2.0許可證,中文文本渲染效果超卓,仲支援對象檢測同語義分割在內的各種先進計算機視覺任務。

公開
*

Qwen Image YouTube 影片

觀看社區演示同教程,了解 Qwen Image 模型的 AI 影像生成同編輯能力

Qwen Image 在 X 上的熱門評價

看看大家在 X (Twitter) 上對 Qwen Image 的評價

Now you can easily create training data for @Alibaba_Qwen Qwen-Image-Edit-2509 in Lorata, and export dataset to @ostrisai's AI Toolkit for training! Everything runs on your local machine👀 Btw, the target image here is also generated using Qwen Image Edit, pretty nice quality✨

Radionic
Radionic
@Radionic0

Just open-sourced Lorata, a new data labeling tool for the GenAI era. You can now easily prepare training data for the text-to-image, image-editing models, and more!✨ An image editor with drawing and cropping tools is also built-in!

Reply

什麼是通義千問影像

阿里巴巴前沿的影像生成AI,具備革命性的文本渲染技術

阿里巴巴技術驅動
200億參數規模
多語言卓越性能
Apache 2.0開源

通義千問影像係200億參數的多模態擴散變壓器,為影像內文本集成設立新標準,在字母文字同表意文字的多行文本渲染方面表現卓越。

通義千問影像的強大功能優勢

發掘令通義千問影像在AI影像生成領域脫穎而出的各種先進功能

頂尖文本渲染

完美渲染字母及表意文字的複雜多行文本,更可在生成影像中準確產出正確中文字元

200億參數大模型

憑藉200億參數多模態擴散變壓器的強大性能,實現極佳的影像質素與細節表現

多風格支援

可生成各式各樣藝術風格的影像,範圍涵蓋逼真相片、抽象藝術、動漫以至數碼插畫

彈性解析度設定

支援從256x256到2048x2048像素的自定義影像尺寸,完美適配任何使用場景

高速生成模式

啟用後可快速輸出成果,專為快速迭代創意同製作想法原型而設

提示詞翻譯

內置翻譯支援,自動將提示詞轉換為英文以獲得最佳生成效果,照顧全球用戶需要

提示詞最佳化

智慧增強提示內容,有效提升生成質素,確保你的創意願景獲得更好呈現

可調引導強度

可微調引導強度由1到20,自由控制生成影像與提示詞的匹配程度

可變步數控制

可自定義推理步數從10到50,協助你在質素同生成速度之間找到完美平衡

種子可重現性

透過指定種子值獲得一致及可重現的生成結果,對迭代設計工作尤其重要

Apache 2.0許可證

作為採用寬鬆Apache 2.0許可證的開源模型,適合個人及商業各類用途

基於積分的定價

高效積分計費系統,按解析度動態定價,每張生成圖片僅需5積分起

通義千問影像相關常見問題

呢度提供有關通義千問影像AI模型及其各項功能的常見問題解答

仲有其他問題?

通義千問影像憑住出色的文本渲染能力突圍而出,尤其係處理複雜多行文本同中文字元的表現更為優秀。作為一個擁有200億參數的多模態擴散變壓器,它擅長將文本直接高精度融入影像之中,呢項能力係好多其他模型難以做到的。它仲支援多種不同藝術風格,並採用Apache 2.0開源許可證。
通義千問影像支援由256x256像素到2048x2048像素的靈活自定義解析度,以64像素作為增量調整。默認解析度為1024x1024,但你可以獨立調整闊度同高度,創建符合你需要、任何縱橫比的影像,由正方形到闊景觀或者高肖像都得。
當然可以!通義千問影像內置翻譯支援,會自動將提示詞轉換為英文以獲得最佳生成效果。呢個設計令全世界的用戶都可以正常使用,唔論佢哋的母語係乜都得。呢個模型本身在生成影像中渲染中文文本都有特殊優勢,非常適合多語言內容創作。
通義千問影像採用動態的基於積分的定價系統。每張圖片的基礎成本為5積分,但最終價格會根據你選擇的解析度調整。更高解析度因為計算需求增加,所以需要更多積分。比如生成2048x2048影像的成本就比1024x1024更高。
快速模式係一項針對速度最佳化的功能,可以實現更快的影像生成,專門用於快速迭代同原型製作。當你正在試驗不同提示詞或者需要快速取得結果時就特別合用。雖然生成質量可能會輕微下降,但佢明顯加快咗整個過程,非常適合頭腦風暴會議或者你需要快速取得多個變體的時候使用。
係的,通義千問影像採用Apache 2.0許可證發布,呢個係非常寬鬆的許可證,同時允許個人同商業使用。你可以將生成的影像用於商業項目、營銷材料、產品設計等等,無需要繳付額外的許可費用。呢種開源模式令初創公司、企業同個人創作者都可以輕鬆使用。

如何使用通義千問影像進行文本生成影像

掌握通義千問影像先進文本渲染能力的專業影像生成技巧

1
精心製作詳細提示詞
2
配置生成設定
3
生成同最佳化您的影像

用任何語言編寫描述性提示詞 - 通義千問影像在簡單同複雜描述方面都表現出色。包含關於風格、構圖、光照以及希望在影像中渲染的任何文本的具體細節。模型內置的翻譯功能確保無論您的輸入語言如何都能獲得最佳結果。

Qwen-Image 圖生圖功能使用指南

活用 Qwen-Image 的高級圖生圖變換能力

1
準備基礎影像
2
編寫詳細提示詞
3
調整強度參數
4
最佳化結果

先準備一張清晰、高質素的基礎影像,Qwen-Image 能夠在完整保留原有構圖的同時,根據詳細提示詞變換風格元素,表現相當出色。

價格

選擇適合您的計劃。沒有隱藏費用,沒有意外。

Basic

Start your AI journey

399.99
1 年
USD
9000points1 月
Priority Support
Early Access
5 GB(Storage Space)
3(Maximum Projects)
Team Members
50 images1 月
Audio Transcription
100 snippets1 月
API Calls
熱門

Professional

Elevate your AI experience

799.99
1 年
USD
27000points1 月
Priority Support
Early Access
20 GB(Storage Space)
10(Maximum Projects)
Team Members
150 images1 月
150 minutes1 月
300 snippets1 月
API Calls

Enterprise

Powerful support for your team

1999.99
1 年
USD
75000points1 月
Priority Support
Early Access
100 GB(Storage Space)
50(Maximum Projects)
10(Team Members)
600 images1 月
600 minutes1 月
1200 snippets1 月
10000 calls1 月