Logo

Qwen Image

Desenvolvido pela Alibaba Cloud, Qwen Image é um modelo versátil de transformador de difusão multimodal de 20 bilhões de parâmetros. Ele se destaca na produção de imagens artísticas e fotorrealistas de alta qualidade, com capacidades avançadas de renderização de texto, e suporta textos complexos de múltiplas linhas tanto em línguas alfabéticas quanto logográficas como o chinês. O modelo entrega edição de imagem de qualidade superior, suporte a múltiplos estilos e interface fácil de usar com prompts simples.

Público
*

Vídeos do YouTube Qwen Image

Assista demonstrações e tutoriais da comunidade exibindo as capacidades de geração e edição de imagens AI com o modelo Qwen Image

Qwen Image Avaliações populares no X

Veja o que as pessoas estão dizendo sobre Qwen Image no X (Twitter)

Now you can easily create training data for @Alibaba_Qwen Qwen-Image-Edit-2509 in Lorata, and export dataset to @ostrisai's AI Toolkit for training! Everything runs on your local machine👀 Btw, the target image here is also generated using Qwen Image Edit, pretty nice quality✨

Radionic
Radionic
@Radionic0

Just open-sourced Lorata, a new data labeling tool for the GenAI era. You can now easily prepare training data for the text-to-image, image-editing models, and more!✨ An image editor with drawing and cropping tools is also built-in!

Reply

O que é Qwen Image

IA de geração de imagens de ponta da Alibaba com renderização de texto revolucionária

AlibabaAlimentado por
20B ParamsEscala
Multi-idiomaExcelência
Apache 2.0Open Source

Qwen Image é um transformador de difusão multimodal de 20 bilhões de parâmetros estabelecendo novos padrões para integração de texto, excelling em renderização de texto multilinha para idiomas alfabéticos e logográficos.

Conheça os recursos poderosos do Qwen Image

Descubra as capacidades avançadas que fazem do Qwen Image uma ferramenta excepcional para geração de imagens com IA

Renderização de texto avançada

Se destaca na renderização de textos complexos multilinha em línguas alfabéticas e logográficas, incluindo geração precisa de caracteres chineses dentro das imagens

Modelo de 20 bilhões de parâmetros

Aproveite todo o poder de um transformador de difusão multimodal de 20 bilhões de parâmetros para entregar imagens com qualidade e detalhes realmente excepcionais

Suporte multi-estilo

Crie imagens em diversos estilos artísticos diferentes, do fotorrealismo à arte abstrata, passando por anime e ilustrações digitais

Resolução flexível

Suporta dimensões de imagem personalizadas de 256x256 a 2048x2048 pixels, perfeito para qualquer caso de uso que você precisar

Modo Flash

Ative o modo de geração acelerada para fazer iterações rápidas e prototipar suas ideias criativas sem demora

Tradução de prompt

Suporte de tradução integrado para converter prompts para inglês para resultados ótimos, atendendo perfeitamente usuários de todo o mundo

Otimização de prompt

Aprimoramento inteligente de prompt para elevar a qualidade da geração e garantir que o resultado fique mais alinhado com a sua visão

Orientação ajustável

Ajuste com precisão a escala de orientação de 1 a 20 para controlar quão fielmente a imagem segue seu prompt

Controle de etapas variável

Personalize as etapas de inferência de 10 a 50 para alcançar o equilíbrio perfeito entre velocidade de geração e qualidade final

Reprodutibilidade por seed

Use valores de seed para obter resultados consistentes e reproduzíveis, um recurso essencial para trabalhos de design iterativo

Licença Apache 2.0

Modelo de código aberto com licença permissiva Apache 2.0, adequado tanto para uso pessoal quanto comercial

Preços baseados em créditos

Sistema de créditos eficiente com preços dinâmicos baseados na resolução, começando a partir de apenas 5 créditos por imagem

Perguntas e respostas frequentes sobre o Qwen Image

Encontre respostas para as dúvidas mais comuns sobre o modelo de IA Qwen Image e todas as suas capacidades

Ainda tem dúvidas?

O Qwen Image se destaca principalmente por suas capacidades incomparáveis de renderização de texto dentro de imagens, especialmente para textos complexos de várias linhas e caracteres chineses. Como um transformador de difusão multimodal de 20 bilhões de parâmetros, ele consegue inserir texto diretamente nas imagens com alta precisão, um ponto em que muitos outros modelos costumam ter dificuldade. Ele também suporta múltiplos estilos artísticos e é distribuído sob a licença open source Apache 2.0.
O Qwen Image aceita resoluções personalizadas flexíveis que vão de 256x256 pixels até 2048x2048 pixels, com incrementos de 64 pixels. A resolução padrão é 1024x1024, mas você pode ajustar largura e altura independentemente para criar imagens em qualquer proporção que atenda às suas necessidades, de quadrado a paisagens amplas ou retratos altos.
Sim! O Qwen Image conta com suporte de tradução integrado que converte automaticamente prompts para o inglês para garantir resultados ótimos. Isso o torna acessível para usuários de todo o mundo, independentemente da sua língua nativa. O modelo também tem uma performance especialmente forte na renderização de texto chinês em imagens geradas, o que o torna ideal para criação de conteúdo multilíngue.
O Qwen Image usa um sistema de preços dinâmico baseado em créditos. O custo base é de 5 créditos por imagem, mas o preço final se ajusta conforme a resolução que você escolher. Resoluções mais altas requerem mais créditos por causa do aumento nos requisitos computacionais. Por exemplo, gerar uma imagem 2048x2048 custa mais do que gerar uma imagem 1024x1024.
O Modo Flash é um recurso de otimização de velocidade que permite geração de imagens mais rápida para iterações rápidas e prototipagem de ideias. Ele é particularmente útil quando você está experimentando diferentes prompts ou precisa de resultados rápidos. Embora possa reduzir ligeiramente a qualidade da geração, ele acelera significativamente o processo, tornando-o perfeito para sessões de brainstorming ou quando você precisa de múltiplas variações rapidamente.
Sim, o Qwen Image é lançado sob a licença Apache 2.0, que é muito permissiva e permite tanto uso pessoal quanto comercial. Você pode usar as imagens geradas para fins comerciais, materiais de marketing, design de produtos e muito mais sem taxas de licença adicionais. Esta abordagem open source o torna acessível para startups, empresas e criadores individuais.

Como usar Qwen Image para geração texto-para-imagem

Domine a geração de imagens profissionais com as capacidades avançadas de renderização de texto do Qwen Image

1
Elabore seu prompt detalhado
2
Configure as definições de geração
3
Gere e refine suas imagens

Escreva prompts descritivos em qualquer idioma - Qwen Image destaca-se tanto com descrições simples quanto complexas. Inclua detalhes específicos sobre estilo, composição, iluminação e qualquer texto que deseje renderizado na imagem. A tradução integrada do modelo garante resultados ótimos independentemente do seu idioma de entrada.

Guia de uso do Qwen-Image para transformação Imagem-para-Imagem

Domine qualquer transformação imagem-para-imagem graças aos recursos avançados do Qwen-Image

1
Prepare sua Imagem Base
2
Escreva Prompts Detalhados
3
Ajuste Parâmetro de Força
4
Otimize os Resultados

Comece com uma imagem nítida e de alta qualidade: o Qwen-Image se destaca por preservar completamente a composição original.

Preços

Escolha o plano certo para você. Sem taxas ocultas, sem surpresas.

Básico

Inicie sua jornada de IA

399.99
1 Ano
USD
9000points1 Mês
Suporte prioritário
Acesso antecipado
5 GB(Espaço de armazenamento)
3(Projetos máximos)
Membros da equipe
50 imagens1 Mês
Transcrição de áudio
100 trechos1 Mês
Chamadas de API
Popular

Profissional

Eleve sua experiência de IA

799.99
1 Ano
USD
27000points1 Mês
Suporte prioritário
Acesso antecipado
20 GB(Espaço de armazenamento)
10(Projetos máximos)
Membros da equipe
150 imagens1 Mês
150 minutos1 Mês
300 trechos1 Mês
Chamadas de API

Empresarial

Suporte poderoso para sua equipe

1999.99
1 Ano
USD
75000points1 Mês
Suporte prioritário
Acesso antecipado
100 GB(Espaço de armazenamento)
50(Projetos máximos)
10(Membros da equipe)
600 imagens1 Mês
600 minutos1 Mês
1200 trechos1 Mês
10000 chamadas1 Mês