Logo

Qwen Image

Desarrollado por Alibaba Cloud, Qwen Image es un modelo versátil de transformador de difusión multimodal de 20 mil millones de parámetros. Se destaca en la creación de imágenes artísticas y fotorrealistas de alta calidad con capacidades avanzadas de renderizado de texto, y admite textos complejos de múltiples líneas tanto en lenguas alfabéticas como logográficas como el chino. El modelo ofrece edición de imágenes de alta calidad, soporte para múltiples estilos y una interfaz fácil de usar con indicaciones sencillas.

Público
*

Videos de YouTube Qwen Image

Vea demostraciones y tutoriales de la comunidad que muestran las capacidades de generación y edición de imágenes AI con el modelo Qwen Image

Qwen Image Reseñas populares en X

Mira lo que la gente dice sobre Qwen Image en X (Twitter)

Now you can easily create training data for @Alibaba_Qwen Qwen-Image-Edit-2509 in Lorata, and export dataset to @ostrisai's AI Toolkit for training! Everything runs on your local machine👀 Btw, the target image here is also generated using Qwen Image Edit, pretty nice quality✨

Radionic
Radionic
@Radionic0

Just open-sourced Lorata, a new data labeling tool for the GenAI era. You can now easily prepare training data for the text-to-image, image-editing models, and more!✨ An image editor with drawing and cropping tools is also built-in!

Reply

Qué es Qwen Image

IA de generación de imágenes vanguardista de Alibaba con renderizado de texto revolucionario

AlibabaImpulsado por
20B ParamsEscala
Multi-idiomaExcelencia
Apache 2.0Open Source

Qwen Image es un transformador de difusión multimodal de 20 mil millones de parámetros que establece nuevos estándares para la integración de texto, sobresaliendo en renderizado de texto multilínea para idiomas alfabéticos y logográficos.

Las potentes funcionalidades de Qwen Image

Explora las capacidades de vanguardia que hacen de Qwen Image una opción excepcional para la generación de imágenes con IA

Renderizado de texto avanzado

Se desempeña de forma sobresaliente en el renderizado de textos complejos de múltiples líneas, tanto en lenguas alfabéticas como logográficas, incluyendo la generación precisa de caracteres chinos dentro de tus imágenes

Modelo de 20 mil millones de parámetros

Aprovecha todo el poder de un transformador de difusión multimodal de 20 mil millones de parámetros para obtener imágenes con una calidad y nivel de detalle excepcionales

Soporte multi-estilo

Genera contenido visual en una amplia gama de estilos artísticos, que van desde el fotorrealismo hasta el arte abstracto, el anime y las ilustraciones digitales

Resolución flexible

Soporta dimensiones de imagen personalizadas de 256x256 a 2048x2048 píxeles, adaptándose perfectamente a cualquier caso de uso que necesites

Modo Flash

Activa este modo de generación acelerada para hacer iteraciones rápidas y prototipar tus ideas creativas en menos tiempo

Traducción de indicaciones

Cuenta con soporte de traducción integrado para convertir tus indicaciones al inglés y conseguir resultados óptimos, pensado para usuarios de todo el mundo

Optimización de indicaciones

Aplica una mejora inteligente a tus indicaciones para aumentar la calidad de generación y garantizar que el resultado se ajuste mejor a tu visión creativa

Guía ajustable

Ajusta con precisión la escala de guía de 1 a 20 para controlar qué tan fielmente la imagen generada sigue tu indicación original

Control de pasos variable

Personaliza los pasos de inferencia de 10 a 50 para conseguir el equilibrio perfecto entre la calidad de la imagen y la velocidad de generación

Reproducibilidad por semilla

Usa valores de semilla para obtener resultados consistentes y reproducibles, una función esencial para el trabajo de diseño iterativo

Licencia Apache 2.0

Se trata de un modelo de código abierto con la licencia permisiva Apache 2.0, apto tanto para uso personal como comercial

Precios basados en créditos

Cuenta con un sistema de créditos eficiente con precios dinámicos basados en la resolución, empezando desde solo 5 créditos por imagen generada

Preguntas frecuentes acerca de Qwen Image

Encuentra aquí respuestas a las dudas más comunes sobre el modelo de IA Qwen Image y todas sus capacidades

¿Tienes más preguntas?

Qwen Image se distingue por su capacidad excepcional para renderizar texto, especialmente para textos complejos de múltiples líneas y caracteres chinos. Como transformador de difusión multimodal de 20 mil millones de parámetros, sobresale al integrar texto directamente en imágenes con gran precisión, un punto en el que muchos otros modelos suelen fallar. También admite una amplia gama de estilos artísticos y se distribuye bajo la licencia de código abierto Apache 2.0.
Qwen Image admite resoluciones personalizadas flexibles desde 256x256 píxeles hasta 2048x2048 píxeles con incrementos de 64 píxeles. La resolución predeterminada es 1024x1024, pero puedes ajustar el ancho y la altura de forma independiente para crear imágenes en cualquier relación de aspecto que se adapte a tus necesidades, desde formato cuadrado hasta paisajes amplios o retratos altos.
¡Sí! Qwen Image incluye soporte de traducción integrado que convierte automáticamente las indicaciones al inglés para obtener resultados óptimos. Esto lo hace accesible para usuarios de todo el mundo, independientemente de su idioma nativo. El modelo también cuenta con una fortaleza particular en el renderizado de texto chino en imágenes generadas, haciéndolo ideal para la creación de contenido multilingüe.
Qwen Image utiliza un sistema de precios dinámico basado en créditos. El costo base es de 5 créditos por imagen, pero el precio final se ajusta según la resolución que elijas. Las resoluciones más altas requieren más créditos debido a los mayores requisitos computacionales. Por ejemplo, generar una imagen de 2048x2048 cuesta más que una imagen de 1024x1024.
El Modo Flash es una función de optimización de velocidad que permite una generación de imágenes más rápida para iteraciones rápidas y trabajo de prototipado. Es particularmente útil cuando estás experimentando con diferentes indicaciones o necesitas resultados en poco tiempo. Aunque puede reducir ligeramente la calidad de generación, acelera significativamente el proceso, haciéndolo perfecto para sesiones de lluvia de ideas o cuando necesitas múltiples variaciones rápidamente.
Sí, Qwen Image se lanza bajo la licencia Apache 2.0, que es muy permisiva y permite tanto uso personal como comercial. Puedes usar imágenes generadas para propósitos comerciales, materiales de marketing, diseño de productos y más sin tarifas de licencia adicionales. Este enfoque de código abierto lo hace accesible para startups, empresas y creadores individuales.

Cómo usar Qwen Image para generación texto-a-imagen

Domina la generación de imágenes profesionales con las capacidades avanzadas de renderizado de texto de Qwen Image

1
Elabora tu prompt detallado
2
Configura ajustes de generación
3
Genera y perfecciona tus imágenes

Escribe prompts descriptivos en cualquier idioma - Qwen Image destaca tanto con descripciones simples como complejas. Incluye detalles específicos sobre estilo, composición, iluminación y cualquier texto que quieras renderizado en la imagen. La traducción integrada del modelo garantiza resultados óptimos independientemente de tu idioma de entrada.

Guía para usar Qwen-Image en transformación Imagen-a-Imagen

Domina cualquier transformación imagen-a-imagen gracias a las capacidades avanzadas de Qwen-Image

1
Prepara tu Imagen Base
2
Escribe Prompts Detallados
3
Ajusta Parámetro de Fuerza
4
Optimiza Resultados

Comienza con una imagen nítida y de alta calidad: Qwen-Image sobresale en la conservación de tu composición original.

Precios

Elige el plan que mejor se adapte a ti. Sin tarifas ocultas, sin sorpresas.

Básico

Comience su viaje de IA

399.99
1 Año
USD
9000points1 Mes
Soporte prioritario
Acceso anticipado
5 GB(Espacio de almacenamiento)
3(Proyectos máximos)
Miembros del equipo
50 imágenes1 Mes
Transcripción de audio
100 fragmentos1 Mes
Llamadas API
Popular

Profesional

Eleve su experiencia de IA

799.99
1 Año
USD
27000points1 Mes
Soporte prioritario
Acceso anticipado
20 GB(Espacio de almacenamiento)
10(Proyectos máximos)
Miembros del equipo
150 imágenes1 Mes
150 minutos1 Mes
300 fragmentos1 Mes
Llamadas API

Empresa

Soporte potente para su equipo

1999.99
1 Año
USD
75000points1 Mes
Soporte prioritario
Acceso anticipado
100 GB(Espacio de almacenamiento)
50(Proyectos máximos)
10(Miembros del equipo)
600 imágenes1 Mes
600 minutos1 Mes
1200 fragmentos1 Mes
10000 llamadas1 Mes