OpenAI acaba de presentar ChatGPT Images 2.0, su nuevo modelo de generación de imágenes con IA. El lanzamiento, anunciado ayer durante una transmisión en vivo con Sam Altman al frente, llega en plena guerra por la imagen generativa entre las grandes tecnológicas.
No es un movimiento casual, Google lleva meses ganando terreno con su familia de modelos Nano Banana, y la versión Nano Banana 2 (basada en Gemini 3.1 Flash Image) se ha convertido en la referencia del sector por velocidad y calidad. OpenAI necesitaba responder, y lo ha hecho con un modelo que promete mucho más que una mejora incremental.

ChatGPT Images 2.0 ya está disponible para todos los usuarios
El modelo, bautizado internamente como gpt-image-2, llega a todos los usuarios de ChatGPT y Codex desde ayer mismo. Las funciones avanzadas, como la generación con razonamiento previo, quedan reservadas para suscriptores de ChatGPT Plus, Pro y Business.
ChatGPT Images 2.0 genera imágenes con texto de forma significativamente mejor, afirmó OpenAI durante la presentación.
Lo que más llama la atención es el salto en renderizado de texto dentro de las imágenes. Hablamos de interfaces de usuario completas, ventanas de escritorio de macOS o chats con texto legible pixel a pixel. Es algo que hasta ahora ningún generador de imágenes conseguía resolver de forma consistente, y OpenAI parece haber dado un paso real en esa dirección.
Dos versiones y resolución hasta 2K
La propuesta se divide en dos variantes: ChatGPT Images 2.0 Instantáneo, pensado para respuestas rápidas, y ChatGPT Images 2.0 Pensando, que incorpora razonamiento antes de generar. Esta segunda versión puede consultar la web en tiempo real, producir varias imágenes distintas desde un solo prompt y verificar sus propios resultados antes de entregarlos.
La resolución máxima sube hasta 2K en relaciones de aspecto que van de 3:1 a 1:3. Eso abre la puerta a formatos como infografías verticales o banners panorámicos sin perder calidad. Además, el modelo mejora la comprensión multilingüe y ahora renderiza con mucha mayor precisión textos en japonés, coreano, chino, hindi y bengalí.
Google no se queda quieta con Nano Banana 2
Mientras tanto, Google sigue avanzando con su propia artillería. Nano Banana 2, lanzado en marzo de 2026, combina la calidad de Nano Banana Pro con la velocidad de Gemini Flash. El modelo permite a los desarrolladores ajustar niveles de razonamiento para mejorar la adherencia a prompts complejos. Y la semana pasada Google fue un paso más allá al integrar Nano Banana con Google Photos, permitiendo generar imágenes personalizadas a partir de la biblioteca fotográfica del usuario.
En mi opinión, esa integración con Photos es el verdadero diferencial de Google ahora mismo. No se trata solo de generar imágenes bonitas, sino de que la IA conozca tu contexto personal y trabaje con él. OpenAI todavía no tiene nada equivalente en ese terreno.
Precios de la API para desarrolladores
Para quienes necesitan acceso a nivel de API, el modelo gpt-image-2 llega con estos precios: 8 dólares por entrada, 2 dólares por entrada en cache y 30 dólares por producción. Son tarifas altas comparadas con lo que ofrece Google a través de la Gemini API, aunque OpenAI apuesta por diferenciarse en calidad de renderizado de texto y precisión en instrucciones complejas.
La batalla por la generación de imágenes con IA entra en una fase mucho más técnica y competitiva. Ya no basta con crear imágenes atractivas. Ahora la clave está en la precisión del texto, la coherencia visual entre múltiples generaciones y la capacidad del modelo para razonar antes de dibujar. Y tanto OpenAI como Google lo saben.

Comentarios!