Noticias destacadas

OpenAI GPT-5.5: Lanzamiento de un nuevo modelo de IA con capacidades de agente avanzadas.

1 de mayo de 2026 por AICC

OpenAI se lanzó GPT-5.5 en 23 de abril como lo llama "una nueva clase de inteligencia para el trabajo real y para potenciar a los agentes", y el encuadre es deliberado. OpenAI dice que es el El modelo de IA con capacidad de agente más avanzado hasta la fecha., diseñado desde cero para planificar, usar herramientas, comprobar sus propios resultados y realizar tareas de forma independiente.

GPT-5.5 es el primer modelo base reentrenado desde GPT-4.5, codiseñado con Sistemas de montaje en rack NVL72 GB200 y GB300 de NVIDIA.La empresa afirma que la diferencia práctica radica en que, al utilizar GPT-5.5, las tareas que antes requerían múltiples indicaciones y "corrección de rumbo" humana ahora pueden delegarse de forma más completa. El modelo se está implementando en Usuarios Plus, Pro, Business y Enterprise en ChatGPT y Codex. Acceso a la API seguido de 24 de abril.

⚡ Los puntos de referencia

La afirmación más sólida de OpenAI sobre el rendimiento se encuentra en Terminal-Bench 2.0, una prueba de rendimiento que evalúa flujos de trabajo de línea de comandos que requieren planificación y coordinación de herramientas en un entorno aislado. Puntuación de GPT-5.5 82,7%, frente al 75,1% de GPT-5.4 y el 69,4% de Claude Opus 4.7.

En SWE-Bench Pro, que evalúa la resolución de problemas de GitHub, GPT-5.5 alcanza 58,6%, resolviendo más problemas en una sola pasada que las versiones anteriores. OpenAI también introdujo Ingeniero de software experto, un punto de referencia interno donde las tareas tienen un tiempo medio estimado de finalización humana de 20 horas. Puntuaciones de GPT-5.5 73,1%, un aumento con respecto al 68,5% de GPT-5.4.

En el razonamiento de contexto largo, MRCR v2 con un millón de tokens, una prueba de rendimiento de recuperación que evalúa si un modelo puede localizar una respuesta específica oculta en un documento extenso, GPT-5.5 obtiene puntuaciones 74,0%, frente al 36,6% de GPT-5.4.

Sin embargo, en Atlas MCPEn la prueba de rendimiento del protocolo de contexto del modelo de Scale AI, Claude Opus 4.7 lidera con un 79,1%, mientras que GPT-5.5 no registra ninguna puntuación. OpenAI incluyó esta ausencia en su propia tabla comparativa, lo que al menos indica su confianza en el panorama general.

💰 Eficiencia de tokens, realidad de precios

El acceso a la API tiene un precio de 5 dólares estadounidenses por millón de tokens de entrada y 30 dólares estadounidenses por millón de tokens de producción, exactamente el doble de las tasas de GPT-5.4. La defensa de OpenAI es que GPT-5.5 completa las mismas tareas de Codex con menos tokens que GPT-5.4, lo que hace que los costos efectivos sean aproximadamente 20% más alto Una vez que se tiene en cuenta su eficiencia, una afirmación que el laboratorio de pruebas independiente Artificial Analysis validó.

GPT-5.5 Pro, disponible para usuarios Pro, Business y Enterprise, tiene un precio de 30 dólares estadounidenses por millón de tokens de entrada y 180 dólares estadounidenses por millón de tokens de producciónAplica computación paralela adicional en tiempo de prueba en problemas más difíciles y encabeza la lista de modelos disponibles públicamente en BrowseComp, el benchmark de navegación web con agentes de OpenAI, en 90,1%.

Vale la pena someter la eficiencia del token a pruebas de estrés con cargas de trabajo reales antes de comprometerse con un cambio de modelo. Con 10 millones de tokens de salida por mes, los costos estándar de GPT-5.5 US$300 contra Claude Opus 4.7 US$250, una prima del 20% que solo resulta rentable si el rendimiento superior del modelo implica menos iteraciones de tareas y menos reintentos, y los cálculos varían según el caso de uso.

🔧 En la práctica

OpenAI dice más que 85% de los empleados Actualmente, Codex se utiliza semanalmente en sus departamentos, incluidos ingeniería y marketing. Por ejemplo, el equipo de comunicaciones utilizó GPT-5.5 para procesar seis meses de datos de solicitudes de ponencias, donde el modelo logró crear un sistema de puntuación y gestión de riesgos que ayudó a automatizar las aprobaciones de bajo riesgo.

Greg Brockman describió el lanzamiento como "un verdadero paso adelante hacia el tipo de computación que esperamos en el futuro", y científico jefe Jakub Pachocki señaló que los últimos dos años de progreso del modelo se habían sentido "Sorprendentemente lento."

OpenAI afirma que GPT-5.5 iguala la latencia por token de GPT-5.4 en el servicio en producción, al tiempo que ofrece un mayor nivel de inteligencia; los modelos más grandes y capaces suelen ser más lentos en el servicio, pero en este caso se evitó esa desventaja.

Conclusión principal: La cuestión de si los resultados de referencia se traducen en mejoras de producción para los equipos que ejecutan pipelines de agentes reales es algo que tardará varias semanas en resolverse adecuadamente. La puntuación de Terminal-Bench es prometedora para los agentes de terminal no supervisados ​​y la automatización de DevOps. La brecha de MCP Atlas es un aspecto que conviene tener en cuenta para quienes se basan en gran medida en la orquestación del uso de herramientas.

Véase también: OpenAI incorpora GPT-5.5 a Codex para tareas de codificación.

(Fuente de la imagen: "Reloj Fossil 'The Agent'" de MarkGregory007 tiene licencia bajo CC BY-NC-SA 2.0)

Más de 300 modelos de IA para
OpenClaw y agentes de IA

Ahorre un 20% en costos