Logo

高性能通义千问图像AI生成器

这是阿里巴巴推出的革命性200亿参数多模态扩散Transformer,拥有行业顶尖的文本渲染能力。无论是字母文字还是表意文字,它都能出色完成复杂多行文本融合任务,同时支持专业图像编辑、风格迁移与对象操控。模型采用Apache 2.0开源许可,中文文本渲染效果尤为出众,还可支持目标检测、语义分割等多种高级计算机视觉任务。

公开
*

Qwen Image YouTube 视频

观看社区演示和教程,了解 Qwen Image 模型的 AI 图像生成和编辑能力

Qwen Image 在 X 上的热门评价

看看大家在 X (Twitter) 上对 Qwen Image 的评价

Now you can easily create training data for @Alibaba_Qwen Qwen-Image-Edit-2509 in Lorata, and export dataset to @ostrisai's AI Toolkit for training! Everything runs on your local machine👀 Btw, the target image here is also generated using Qwen Image Edit, pretty nice quality✨

Radionic
Radionic
@Radionic0

Just open-sourced Lorata, a new data labeling tool for the GenAI era. You can now easily prepare training data for the text-to-image, image-editing models, and more!✨ An image editor with drawing and cropping tools is also built-in!

Reply

什么是通义千问图像

阿里巴巴前沿的图像生成AI,具备革命性的文本渲染技术

阿里巴巴技术驱动
200亿参数规模
多语言卓越性能
Apache 2.0开源

通义千问图像是200亿参数的多模态扩散变压器,为图像内文本集成设立新标准,在字母文字和表意文字的多行文本渲染方面表现卓越。

通义千问图像的强悍核心功能

一同解锁通义千问图像在AI图像生成领域脱颖而出的众多领先功能

先进的文本渲染

完美处理字母与表意文字的复杂多行排版,更能精准在图像中生成正确的中文字符

200亿参数模型

依托200亿参数多模态扩散变压器的强大能力,带来远超同类的出众画质与丰富细节

多风格支援

可生成各类艺术风格的图像,从写实照片、抽象艺术到动漫、数字插画都能轻松实现

灵活的解析度

支持从256x256到2048x2048像素的自定义图像尺寸,无论什么使用场景都能完美适配

快速模式

开启快速生成模式,满足创意快速迭代和想法原型快速打磨的需求

提示词翻译

内置翻译支持,自动将提示词转换为英文以获得最优生成效果,适配全球用户使用需求

提示词优化

智能增强提示内容,有效提升生成质量,帮你更精准地还原专属创意愿景

可调引导强度

支持在1到20区间微调引导强度,自由控制生成图像与提示词的匹配程度

可变步数控制

可自定义10到50区间的推理步数,帮你在生成质量和出图速度间找到完美平衡

种子可重现性

通过固定种子值获得一致可复现的生成结果,对迭代设计工作来说必不可少

Apache 2.0许可证

采用宽松Apache 2.0许可证的开源模型,个人使用与商业项目都完全适用

基于积分的定价

采用高效积分计费系统,根据分辨率动态定价,单张图片生成仅需5积分起

关于通义千问图像的常见问题解答

这里整理了通义千问图像AI模型及其各项功能的常见疑问解答

还有其他问题?

通义千问图像凭借顶尖的文本渲染能力脱颖而出,尤其擅长处理复杂多行文本和中文字符。作为参数规模200亿的多模态扩散变压器,它可以高精度地直接将文本融入生成图像当中,这是很多其他模型都难以实现的效果。它同时支持多种艺术风格创作,并且采用Apache 2.0开源许可证开放使用。
通义千问图像支持灵活自定义分辨率,范围从256x256像素到2048x2048像素,以64像素为调整增量。默认输出分辨率为1024x1024,但你可以独立调整宽度和高度,生成任意符合需求纵横比的图像,无论是正方形、宽幅风景图还是高竖人像图都可以实现。
当然可以!通义千问图像自带内置翻译支持,会自动将提示词转换为英文以获得最佳生成效果,无论母语是什么,全球各地用户都可以正常使用。该模型本身在生成图像内渲染中文文本就有特殊优势,非常适合多语言内容创作场景。
通义千问图像采用动态的基于积分的定价体系,单张图片的基础成本为5积分,最终价格会根据你选择的分辨率进行调整。更高分辨率需要更多计算资源,因此消耗的积分也更多,例如生成2048x2048图像的成本就高于1024x1024图像。
快速模式是针对生成速度优化的功能,可以实现更快的出图速度,适合快速迭代和原型验证。当你试验不同提示词效果,或是需要快速拿到结果时,这个功能格外实用。虽然开启后可能会有轻微的质量下降,但它能显著缩短生成流程,非常适合头脑风暴阶段,或是你需要快速获得多个变体的场景。
是的,通义千问图像采用Apache 2.0许可证发布,这是一款非常宽松的许可证,同时允许个人和商业使用。你可以将生成的图像用于商业项目、营销物料、产品设计等各类用途,不需要支付额外的授权费用。这种开源开放的模式,不管是初创公司、企业还是个人创作者都可以轻松使用。

通义千问图像文本生成图像使用指南

活用通义千问图像出众的文本渲染能力,掌握专业级AI图像生成实用技巧

1
打磨清晰具体的生成提示词
2
调整生成参数配置
3
生成图像并优化调整

你可以用任意语言编写描述性提示,通义千问图像无论是简单需求还是复杂描述都能精准呈现。记得补充风格、构图、光影的具体要求,以及你想要渲染在图像中的所有文字细节,模型自带内置翻译功能,无论你用哪种语言输入,都能输出符合预期的优质结果。

Qwen-Image 图生图功能使用指南

借助 Qwen-Image 的强大能力,轻松玩转高级图生图变换

1
准备基础图像
2
编写详细提示词
3
调整强度参数
4
优化结果

从清晰优质的原始图像开始操作,Qwen-Image 擅长在完整保留原构图的前提下,根据你的详细提示词变换风格元素,效果出众。

灵活的 AI 定价

按量付费或订阅计划。无隐藏费用,随时取消。

基础版

开始您的AI之旅

399.99
1 年
USD
90001 月
优先客服支持
抢先体验新功能
5 GB(存储空间)
3(最大项目数)
团队成员
501 月
音频转文字
1001 月
API调用
热门

专业版

提升您的AI体验

799.99
1 年
USD
270001 月
优先客服支持
抢先体验新功能
20 GB(存储空间)
10(最大项目数)
团队成员
1501 月
150 分钟1 月
3001 月
API调用

企业版

为您的团队提供强大支持

1999.99
1 年
USD
750001 月
优先客服支持
抢先体验新功能
100 GB(存储空间)
50(最大项目数)
10(团队成员)
6001 月
600 分钟1 月
12001 月
100001 月