OpenAI acaba de presentar GPT-5.5, apenas seis semanas después de GPT-5.4. El nuevo modelo apunta directamente a la codificación autónoma, el manejo de software sin intervención humana y la investigación automatizada. Llega a ChatGPT y Codex para suscriptores de pago desde ayer mismo.
Lo que hace distinto a este lanzamiento no es solo el rendimiento bruto. Es la velocidad con la que OpenAI está iterando. Seis semanas entre versiones dice mucho sobre la presión competitiva que ejerce Anthropic con Claude y Google con Gemini. GPT-5.5 quiere recuperar terreno en el segmento empresarial, y los números que presenta son bastante agresivos.

Qué puede hacer GPT-5.5 en codificación y tareas de agente
Según la propia OpenAI, este modelo no necesita que le indiques cada paso. Planifica, elige herramientas, verifica su propio trabajo y sigue ejecutando hasta completar el objetivo. En la práctica, eso significa que puede escribir código, depurarlo, analizar datos, crear documentos y buscar información en la web sin supervisión constante.
Lo que hace realmente especial a este modelo es cuánto más puede hacer con menos guía, explicó Greg Brockman, presidente de OpenAI, durante la presentación a medios.
Los benchmarks que maneja OpenAI son llamativos, aunque conviene tomarlos con cautela porque vienen del propio fabricante. En Terminal-Bench 2.0, que mide flujos complejos de línea de comandos con planificación e iteración, GPT-5.5 obtuvo un 82,7% frente al 75,1% de GPT-5.4. En SWE-Bench Pro, centrado en resolver incidencias reales de GitHub, alcanzó el 58,6%.
Uso autónomo de ordenadores y tareas profesionales
Donde el salto parece más notable es en el manejo directo de software. En OSWorld-Verified, que evalúa cómo un agente opera un ordenador real sin ayuda, el modelo llegó al 78,7%. Y en GDPval, que mide la capacidad para completar tareas de conocimiento en 44 profesiones distintas, marcó un 84,9%.
Otro dato que llama la atención: en Tau2-bench Telecom, un test de flujos complejos de atención al cliente, GPT-5.5 alcanzó el 98% sin ajustes de prompt. Ese tipo de puntuación sugiere que OpenAI está apostando fuerte por el mercado de automatización empresarial, donde cada interacción con un cliente cuesta dinero real.
Disponibilidad, precios y lo que falta por llegar
El modelo ya está disponible en ChatGPT para usuarios Plus, Pro, Business y Enterprise. También funciona en Codex, la herramienta de codificación de OpenAI, con una ventana de contexto de 400K tokens. Existe además una variante Pro con razonamiento extendido, limitada a los planes Pro, Business y Enterprise.
Para desarrolladores, la API aún no está activa. OpenAI ha confirmado los precios: 5 dólares por millón de tokens de entrada y 30 dólares por millón de salida para GPT-5.5 estándar. La versión Pro costará 30 y 180 dólares respectivamente. Son el doble que GPT-5.4, aunque la compañía asegura que el modelo gasta menos tokens para completar las mismas tareas.
Hay que poner estos precios en contexto. OpenAI está cobrando más por token, pero promete mayor eficiencia por tarea. Eso significa que el coste real dependerá del tipo de carga de trabajo. Para tareas pesadas de codificación y agentes, puede salir rentable. Para usos más sencillos, GPT-5.4 o su versión mini seguirán siendo la opción lógica.
Seguridad y el contexto competitivo
OpenAI probó el modelo con unos 200 socios antes del lanzamiento público. La compañía clasificó las capacidades de ciberseguridad de GPT-5.5 como «High» dentro de su marco de preparación, aunque sin alcanzar el nivel «Critical». Mia Glaese, vicepresidenta de investigación, destacó que llevan meses trabajando en salvaguardas de ciberseguridad con modelos cada vez más capaces.
Este lanzamiento llega pocos días después de que Anthropic presentara Claude Mythos Preview, con capacidades avanzadas en ciberseguridad. La coincidencia no es casual. Las dos empresas compiten por el mismo cliente empresarial, y cada lanzamiento responde al anterior. Con 900 millones de usuarios activos semanales y 50 millones de suscriptores, OpenAI tiene la base instalada. La pregunta es si puede mantener la ventaja técnica al ritmo que exige este mercado.

Comentarios!