Главные новости

OpenAI GPT-5.5: Выпущена новая модель ИИ с расширенными возможностями агентного управления.

2026-05-01 от AICC

Компания OpenAI запустила проект. ГПТ-5.5 на 23 апреля как то, что это называет «Новый класс интеллекта для реальной работы и обеспечения работы агентов». И формулировка намеренная. OpenAI утверждает, что это... самая мощная на сегодняшний день агентная модель искусственного интеллектаРазработанная с нуля для планирования, использования инструментов, проверки собственных результатов и самостоятельного выполнения задач.

ГПТ-5.5 Это первая переобученная базовая модель со времен GPT-4.5, разработанная совместно с Стойковые системы NVIDIA GB200 и GB300 NVL72Компания заявляет, что практическое отличие заключается в том, что при использовании GPT-5.5 задачи, которые ранее требовали множества подсказок и ручной «коррекции», теперь могут быть переданы более полно. Модель внедряется в... Кроме того, для пользователей категорий Pro, Business и Enterprise. в ChatGPT и Codex. Доступ к API был предоставлен позже. 24 апреля.

⚡ Контрольные показатели

Наиболее убедительное заявление OpenAI о производительности касается Терминальный стенд 2.0GPT-5.5 — это бенчмарк, проверяющий рабочие процессы командной строки, требующие планирования и координации инструментов в изолированной среде. 82,7%против 75,1% у GPT-5.4 и 69,4% у Claude Opus 4.7.

На SWE-Bench ProGPT-5.5, который оценивает процесс решения проблем в GitHub, достигает своей цели. 58,6%, решая больше задач за один проход, чем предыдущие версии. OpenAI также представила Эксперт-программистВнутренний эталонный показатель, в котором среднее расчетное время выполнения задач человеком составляет 20 часов. Показатели GPT-5.5. 73,1%, что выше показателя GPT-5.4 в 68,5%.

В рассуждениях, основанных на длительном контексте, MRCR v2 при достижении одного миллиона токеновGPT-5.5 — это тест производительности поиска, проверяющий, может ли модель найти конкретный ответ, скрытый в большом документе. 74,0%против 36,6% у GPT-5.4.

Однако, на Атлас MCPВ бенчмарке Scale AI Model Context Protocol (MTP) лидирует Claude Opus 4.7 с результатом 79,1%, а GPT-5.5 не показывает никаких результатов. OpenAI включила это отсутствие в свою собственную таблицу бенчмарков, что, по крайней мере, свидетельствует о её уверенности в общей картине.

💰 Эффективность токенов, реальность ценообразования

Стоимость доступа к API составляет [указать цену]. 5 долларов США за миллион входных токенов и 30 долларов США за миллион токеновВ итоге, скорость обработки данных у GPT-5.4 ровно вдвое выше, чем у GPT-5.4. В защиту OpenAI выступает тот факт, что GPT-5.5 выполняет те же задачи Codex с меньшим количеством токенов, чем GPT-5.4, что делает эффективную стоимость примерно равной... на 20% выше если учесть его эффективность, что подтвердила независимая испытательная лаборатория Artificial Analysis.

GPT-5.5 ProДоступная пользователям категорий Pro, Business и Enterprise, эта версия предлагается по цене [цена]. 30 долларов США за миллион входных токенов и 180 долларов США за миллион токенов.Она применяет дополнительные параллельные вычисления во время тестирования для более сложных задач и возглавляет список общедоступных моделей. BrowseComp, эталонный тест OpenAI для агентного веб-серфинга, на 90,1%.

Перед принятием решения о смене модели стоит проверить эффективность токена на реальных рабочих нагрузках. При объеме выпуска 10 миллионов токенов в месяц стандарт GPT-5.5 обходится в определенную сумму. 300 долларов США против Клода Опуса 4.7 250 долларов СШАЭто 20-процентная надбавка, которая окупается только в том случае, если превосходная производительность агента модели означает меньшее количество итераций задачи и меньшее количество повторных попыток, при этом математические расчеты варьируются в зависимости от конкретного случая.

🔧 На практике

OpenAI говорит больше, чем 85% сотрудников Теперь они используют Codex еженедельно в своих отделах, включая инженерный и маркетинговый. Например, команда по связям с общественностью использовала GPT-5.5 для обработки данных о запросах на выступления за шесть месяцев, и модель смогла создать систему оценки и анализа рисков, которая помогла автоматизировать утверждения с низким уровнем риска.

Грег Брокман описали релиз как «Это настоящий шаг вперед к тому типу вычислительных систем, которые мы ожидаем в будущем». и главный научный сотрудник Якуб Пачоцкий отметили, что прогресс в разработке модели за последние два года ощущался «Удивительно медленно».

По данным OpenAI, GPT-5.5 по времени обработки токенов соответствует GPT-5.4 при работе в производственной среде, демонстрируя при этом более высокий уровень интеллекта; более крупные и мощные модели часто работают медленнее, но здесь удалось избежать этого компромисса.

Главный вывод: Вопрос о том, приведут ли результаты бенчмарка к повышению производительности команд, использующих реальные конвейеры обработки данных с помощью агентов, станет ответом на него лишь через несколько недель. Показатель Terminal-Bench выглядит многообещающим для автоматизированных терминальных агентов и автоматизации DevOps. Разрыв между MCP и Atlas заслуживает внимания всех, кто активно использует оркестровку инструментов.

См. также: OpenAI внедряет GPT-5.5 в Codex для решения задач программирования.

(Источник изображения: «The Agent Fossil Watch» от MarkGregory007, лицензировано в соответствии с условиями лицензии) CC BY-NC-SA 2.0)

Более 300 моделей ИИ для
OpenClaw и агенты искусственного интеллекта

Сэкономьте 20% на расходах