OpenAI GPT-5.5: Novo modelo de IA com capacidades agentivas avançadas é lançado.
A OpenAI lançou GPT-5.5 sobre 23 de abril como o que chama "uma nova classe de inteligência para trabalho real e para capacitar agentes", e o enquadramento é deliberado. A OpenAI diz que é o o modelo de IA agente mais capaz até o momento, construída desde a base para planejar, usar ferramentas, verificar seus próprios resultados e executar tarefas de forma independente.
GPT-5.5 é o primeiro modelo base retreinado desde o GPT-4.5, desenvolvido em conjunto com Sistemas de rack de escala GB200 e GB300 NVL72 da NVIDIAA empresa afirma que a diferença prática é que, ao usar o GPT-5.5, tarefas que antes exigiam várias instruções e "correção de rumo" humana agora podem ser delegadas de forma mais completa. O modelo está sendo implementado em breve. Usuários das versões Plus, Pro, Business e Enterprise no ChatGPT e no Codex. O acesso à API foi seguido em 24 de abril.
⚡ Os indicadores de desempenho
A principal alegação de desempenho da OpenAI é sobre Bancada de terminais 2.0, um benchmark que testa fluxos de trabalho de linha de comando que exigem planejamento e coordenação de ferramentas em um ambiente isolado. Pontuações do GPT-5.5 82,7%, contra 75,1% do GPT-5.4 e 69,4% do Claude Opus 4.7.
Sobre SWE-Bench Pro, que avalia a resolução de problemas do GitHub, o GPT-5.5 atinge 58,6%, resolvendo mais problemas em uma única passagem do que as versões anteriores. A OpenAI também apresentou Especialista-SWE, um parâmetro de referência interno onde as tarefas têm um tempo médio estimado de conclusão humana de 20 horas. Pontuações do GPT-5.5 73,1%, um aumento em relação aos 68,5% do GPT-5.4.
No raciocínio de contexto longo, MRCR v2 com um milhão de tokens, um teste de benchmark de recuperação que avalia se um modelo consegue localizar uma resposta específica em um documento extenso, pontuações do GPT-5.5 74,0%, contra 36,6% do GPT-5.4.
No entanto, em Atlas MCPNo benchmark de uso de ferramentas do Model Context Protocol da Scale AI, o Claude Opus 4.7 lidera com 79,1%, enquanto o GPT-5.5 não obteve pontuação. A OpenAI incluiu essa ausência em sua própria tabela de benchmarks, o que, pelo menos, demonstra sua confiança no panorama geral.
💰 Eficiência de Tokens, Realidade de Preços
O acesso à API tem o preço de US$ 5 por milhão de tokens de entrada e US$ 30 por milhão de tokens emitidos, exatamente o dobro das taxas do GPT-5.4. A defesa da OpenAI é que o GPT-5.5 completa as mesmas tarefas do Codex com menos tokens do que o GPT-5.4, tornando os custos efetivos aproximadamente 20% mais alto Levando-se em consideração sua eficiência, essa afirmação foi validada pelo laboratório independente de testes Artificial Analysis.
GPT-5.5 ProDisponível para usuários Pro, Business e Enterprise, o preço é de US$ 30 por milhão de tokens de entrada e US$ 180 por milhão de tokens de saídaEle aplica computação paralela adicional em tempo de teste em problemas mais difíceis e lidera a lista de modelos disponíveis publicamente em BrowseComp, o benchmark de navegação web com agentes da OpenAI, em 90,1%.
A eficiência dos tokens deve ser testada sob condições extremas com cargas de trabalho reais antes de se comprometer com uma mudança de modelo. Com 10 milhões de tokens de saída por mês, o padrão GPT-5.5 custa [valor omitido]. US$ 300 contra Claude Opus 4.7 US$ 250, um acréscimo de 20% que só compensa se o desempenho superior do modelo em termos de agência significar menos iterações de tarefas e menos tentativas, com os cálculos variando de acordo com o caso de uso.
🔧 Na prática
A OpenAI afirma que mais do que 85% dos funcionários Agora, o Codex é usado semanalmente em seus departamentos, incluindo engenharia e marketing. Em um exemplo, a equipe de comunicação usou o GPT-5.5 para processar seis meses de dados de solicitações de palestras, onde o modelo foi capaz de construir uma estrutura de pontuação e risco para ajudar a automatizar as aprovações de baixo risco.
Greg Brockman descreveu o lançamento como "Um verdadeiro passo em frente rumo ao tipo de computação que esperamos no futuro." e cientista-chefe Jakub Pachocki observou que os últimos dois anos de progresso do modelo tinham sido sentidos "Surpreendentemente lento."
A OpenAI afirma que o GPT-5.5 iguala a latência por token do GPT-5.4 em produção, ao mesmo tempo que apresenta um nível de inteligência superior; modelos maiores e mais capazes costumam ser mais lentos para atender aos pedidos, mas essa compensação foi evitada neste caso.
Ponto-chave: A questão de saber se os resultados do benchmark se traduzirão em ganhos de produção para equipes que executam pipelines de agentes reais é algo que só as próximas semanas poderão responder adequadamente. A pontuação do Terminal-Bench é promissora para agentes de terminal não supervisionados e automação de DevOps. A diferença no MCP Atlas merece atenção de qualquer pessoa que esteja desenvolvendo soluções com base na orquestração do uso de ferramentas.
Veja também: A OpenAI disponibiliza o GPT-5.5 no Codex para tarefas de programação.
(Fonte da imagem: "'The Agent' Fossil Watch" de MarkGregory007 está licenciada sob CC BY-NC-SA 2.0)


Conecte-se










