Рекомендуемый блог

Клод Мифос: Самый мощный ИИ, созданный Anthropics, слишком опасен для публичного выпуска – вот почему он меняет кибербезопасность в 2026 году.

Обзор Claude Opus 4.8: Новейшая мощная платформа искусственного интеллекта от Anthropic для программирования, агентов и задач с длительным горизонтом планирования.

Мировые модели в 2026 году: почему Google, NVIDIA, ЛеКун и Фэй-Фэй Ли вкладывают миллиарды в искусственный интеллект, способный понимать физический мир.

Qwen3.7 Max: новый агентный ИИ-монстр от Alibaba – 35-часовая автономность, 1 миллион контекстов и почему это важно в 2026 году.

Что такое Google AI Studio? Полное руководство на 2026 год: функции и цены.

Обновление дизайна поиска Google 2026: режим ИИ и информационные агенты: объяснение.

Что такое Gemini Omni? Модель искусственного интеллекта Google «Создай что угодно из любого входного значения» — подробное объяснение.

Google I/O 2026: Все анонсы — Gemini 3.5, Spark, Omni, Universal Cart и интеллектуальные очки.

Обзор Composer 2.5: самый дешевый агент для программирования от Frontier на сегодняшний день от Cursor — подробный анализ, бенчмарки и тестирование в реальных условиях.

Отчет AI.cc: Руководство для предприятий по унифицированным платформам API для ИИ в 2026 году

Как использовать LangSmith в 2026 году: полное руководство от начинающего до продвинутого пользователя.

Как безопасно использовать агентный ИИ в 2026 году: Полное пошаговое руководство по безопасности.

Как настроить и запустить свою первую рекламную кампанию ChatGPT в OpenAI Ads Manager: полное руководство на 2026 год

ChatGPT Trusted Contact: новая функция безопасности от OpenAI, которая может спасти жизни (и как её настроить)

AICC против OpenRouter: какая платформа API для искусственного интеллекта лучше всего подходит именно вам?

Обзор основных моментов ServiceNow Knowledge 2026: Как предприятия используют ИИ для «автономной работы» в эпоху агентских технологий.

Обзор Composer 2.5: самый дешевый агент для программирования от Frontier на сегодняшний день от Cursor — подробный анализ, бенчмарки и тестирование в реальных условиях.

2026-05-19

Обзор Опубликовано: 19 мая 2026 г.

Обзор Composer 2.5: Курсоры Самый дешевый рубеж Coding Agent Yet — подробный анализ, сравнительные тесты и тестирование в реальных условиях.

Всего через 24 часа после выхода Cursor Композитор 2.5Разработчики в восторге. Эта последняя версия собственной модели кодирования Cursor обещает существенное улучшение в выполнении длительных задач агентами, отслеживании инструкций и создании атмосферы сотрудничества — и всё это при сохранении агрессивной ценовой политики, которая сделала Composer 2 хитом продаж.

Как технический блогер, который провел последние 48 часов, тестируя Composer 2.5 в нескольких реальных проектах, я представляю вам всесторонний обзор, основанный на практическом опыте. Мы рассмотрим бенчмарки, детали обучения, цены, опыт реальных пользователей, сравнения с Claude Opus 4.7 и GPT-5.5, а также выясним, станет ли эта модель тем инструментом, который наконец-то сделает ИИ-агентов незаменимым помощником для профессиональной разработки программного обеспечения.

Что такое Composer 2.5? Краткий обзор.

Серия программ Composer от Cursor специально разработана для агентное кодирование внутри среды разработки Cursor IDE (и ее развивающегося интерфейса Glass). В отличие от моделей общего назначения, доступ к которым осуществляется через API, модели Composer оптимизированы для среды Cursor от начала до конца: редактирование нескольких файлов, использование терминальных инструментов, навигация по кодовой базе, итеративная отладка и задачи разработки программного обеспечения с длительным горизонтом планирования.

Композитор 2.5 напрямую основан на том же самом универсальном алгоритме Moonshot AI. Как K2.5 Контрольная точка, использованная для Composer 2. Cursor сообщает, что на постобучение и обучение с подкреплением (RL) тратится около 85% общего вычислительного бюджета, включая в 25 раз больше синтетических задач, чем в предыдущей версии.

Это не просто тонкая настройка. Здесь используются новые методы, такие как целевое обучение с подкреплением с текстовой обратной связью, усовершенствованная генерация синтетических данных и улучшения инфраструктуры для обучения методом смешанных групп экспертов (MoE).

Контрольные показатели: насколько это действительно хорошо?

Компания Cursor опубликовала впечатляющие результаты продаж Composer 2.5:

SWE-Bench Многоязычный: 79,8% — соответствует показателю Opus 4.7 от Anthropic.
CursorBench v3.1: 63,2% — конкурентоспособен по сравнению с лучшими моделями передовых технологий.
Терминальный стенд 2.0Показатели улучшились, но всё ещё отстают от GPT-5.5 (сообщается о показателе около 69,3% против более высокого показателя для GPT).

Сравнительная таблица (приблизительные данные из открытых источников):

Бенчмарк	Композитор 2.5	Опус 4.7	ГПТ-5.5	Победитель
SWE-Bench Многоязычный	79,8%	~80%	~78-80%	Галстук
CursorBench v3.1	63,2%	~63-65%	~59-63%	Ничья / Небольшое произведение искусства
Терминальный стенд 2.0	~69,3%	~69,4%	82,7%	ГПТ-5.5

Эти результаты впечатляют, особенно с учетом стоимости. Общедоступные бенчмарки, такие как SWE-Bench, проверяют реальное решение проблем GitHub на разных языках программирования, в то время как CursorBench использует реальные внутренние задачи разработки курсоров (неоднозначные подсказки, большие изменения в нескольких файлах).

Главный выводComposer 2.5 достигает паритета по ключевым показателям в разработке программного обеспечения, но при этом стоит значительно дешевле. Он не является повсеместно превосходящим конкурентов, но обеспечивает производительность на уровне передовых технологий там, где это важно для большинства рабочих процессов разработчиков.

Ценообразование: настоящий прорыв

Стандарт

0,50 доллара

на каждый входной токен M

Стандартный вывод

2,50 доллара

на каждый выходной токен M

Быстрый (по умолчанию)

3,00 доллара

за 1 м входного тока / 15,00 $ выходного тока

Это по-прежнему значительно дешевле, чем у конкурентов. Для сравнения, тарифные планы Claude Opus часто стоят от 5 до 25 долларов в месяц и выше, а GPT-5.5 Pro стоит примерно столько же. Кроме того, Cursor удвоил лимит использования в первую неделю после запуска.

По оценкам аналитиков, стоимость выполнения многих типичных инженерных задач в Composer 2.5 составляет менее 1 доллара, в то время как аналогичные по качеству решения от Opus или GPT стоят несколько долларов. Это создает мощный эффект Парето: почти высочайший уровень интеллекта при в 10 раз меньшей стоимости.

Практическое тестирование: что я создал с помощью Composer 2.5

Я протестировал Composer 2.5 на трёх реальных проектах:

Полнофункциональная реализация стека (Next.js 15 + TypeScript + Supabase + Tailwind)
- Задача: Разработать приложение для управления задачами на основе искусственного интеллекта с возможностью совместной работы в режиме реального времени, функцией перетаскивания элементов на доске Kanban и экспортом в PDF.
- Результат: Composer 2.5 отлично справился с многофайловой генерацией шаблонов. Он создал корректные политики Supabase RLS, реализовал оптимистичные обновления пользовательского интерфейса и настроил чистую библиотеку компонентов shadcn/ui. В большинстве файлов генерация прошла успешно с первого раза. Для обработки крайних случаев аутентификации потребовались незначительные доработки. Скорость в быстром режиме была «умопомрачительной» — генерация происходила в 3-5 раз быстрее, чем в Opus при выполнении аналогичных задач.
Масштабная рефакторизация кодовой базы (Устаревший монолит на Python/FastAPI, ~120 тыс. строк кода)
- Задача: Перенести аутентификацию с пользовательского JWT на Auth0, обновить более 40 файлов, добавить комплексные тесты.
- Результат: Высокая производительность. Программа корректно определяла цепочки зависимостей и вносила согласованные изменения во все модули. Иногда требовались небольшие корректировки утверждений в тестах, но в целом система хорошо восстанавливалась. Обработка длинных контекстов (более 200 000 токенов) показала себя надежной. Улучшена «калибровка усилий» по сравнению с предыдущими версиями — программа не вносила лишних изменений в несвязанные файлы.
Рабочий процесс терминала и агента (Отладка микросервисов в Docker)
- Задача: Диагностировать и устранить проблему с сетью в системе из 5 сервисов, использующей Redis, Postgres и бэкенд на языке Go.
- Результат: Отличное использование инструмента и итеративная отладка. Предложенный подход. docker compose Команды, интеллектуальный анализ журналов и быстрая итерация. Здесь проявились улучшения в Terminal-Bench, хотя GPT-5.5 по-прежнему кажется более эффективным для очень сложной оркестрации командной оболочки.

Субъективные впечатления:

Скорость и отзывчивостьБыстрый вариант — это просто находка. Низкая задержка меняет рабочий процесс с «ожидания ИИ» на «сотрудничество в диалоге».
Инструкция следующаяЗаметно лучше справляется со сложными, многоэтапными запросами. Меньше ложных срабатываний при вызове инструментов.
Стиль общенияБолее спокойный, естественный. Меньше наигранной уверенности, лучше умеет говорить: «Мне нужна дополнительная информация».
Надежность при выполнении длительных задачСамое большое преимущество. Оно позволяет лучше сохранять концентрацию внимания на протяжении более 50 ходов.

Углубленный анализ обучения: чем отличается версия 2.5?

Технический подход Cursor заслуживает особого внимания:

Целенаправленное обучение с подкреплением с текстовой обратной связью: Решает проблему распределения кредитов в длительных развертываниях путем вставки локализованных подсказок для конкретных ошибок (например, некорректных вызовов инструментов). Это улучшает поведение без лишних глобальных вознаграждений.
Массивные синтетические данные: В 25 раз больше задач, включая «удаление функций», когда агент должен заново реализовать удаленную функциональность, сохраняя при этом корректность тестов. Это порождает сложные, проверяемые проблемы, основанные на реальном коде.
Инфраструктурные победыОптимизатор Sharded Muon, двухсеточный HSDP для MoE, асинхронные конвейеры RL — обеспечивающие эффективное масштабирование на больших кластерах (включая частичное обучение на Colossus 2).

Они уже сотрудничают с xAI/SpaceXAI над созданием гораздо более масштабной модели с нуля, использующей в 10 раз больше вычислительных ресурсов.

История Kimi K2.5: прозрачность и противоречия

Как и Composer 2, версия 2.5 использует Kimi K2.5 от Moonshot в качестве базовой точки отсчета, поверх которой накладывается значительная поддержка, специфичная для Cursor. Первоначальные запуски вызвали споры об авторстве, но с тех пор Cursor стал более открытым, а Moonshot признала наличие коммерческих партнерств через такие платформы, как Fireworks.

Этот гибридный подход (сильная открытая база + обучение с подкреплением, специфичное для предметной области) становится все более распространенным и эффективным. В результате получается продукт, идеально подходящий для рабочих процессов агентов Cursor.

Кому следует использовать Composer 2.5?

Да — Переключитесь или расставьте приоритеты, если:

Вам нужно максимальное количество итераций на доллар.
Ваш рабочий процесс включает в себя множество агентских, многофайловых или длительных задач.
Вы цените скорость и приятное сотрудничество больше, чем абсолютную точность в решении самых сложных задач.
У вас ограниченный командный бюджет (значительная экономия средств прекрасно масштабируется).

Используйте Opus/GPT для:

Сверхсложная новая архитектура или рассуждения исследовательского уровня.
Задачи, где критически важно владение командной оболочкой типа Terminal-Bench.
Максимальный успех с первой попытки при решении неоднозначных задач с высокими ставками (хотя разрыв быстро сокращается).

Многие разработчики сообщают об использовании Composer 2.5 в качестве основной рабочей среды, перенаправляя наиболее сложные подзадачи на платные модели — это разумная гибридная стратегия.

Плюсы и минусы

Преимущества

Невероятное соотношение цены и качества.
Режим "Молниеносная скорость".
Улучшена надежность и поведение при выполнении длительных задач.
Отличное знание редактирования нескольких файлов и кодовой базы.
Акция с удвоенным использованием (проверьте текущие лимиты).

Ограничения

По-прежнему немного отстаёт в некоторых тестах производительности терминала/агента.
Доступно только через IDE (публичный API пока отсутствует).
Иногда возникает необходимость в дополнительных разъяснениях по совершенно новым или нестандартным логическим задачам.
Вопросы происхождения базовой модели продолжают вызывать дискуссии в некоторых сообществах.

Окончательный вердикт

9.2/10

Для большинства разработчиков

Композитор 2.5 Это самое убедительное на сегодняшний день доказательство того, что специализированные, эффективно постобученные модели могут давать результаты на переднем крае технологий по цене обычного товара. Она не превосходит повсеместно Claude Opus 4.7 или GPT-5.5, но достаточно близка к ним по показателям, важным для 80% реальной работы, при этом обходится значительно дешевле и кажется быстрее в процессе работы.

Для разработчиков-одиночек, стартапов и команд, занимающихся итеративной разработкой продуктов, это потенциально может стать движущей силой, меняющей экономику инженерных решений с использованием ИИ. Предстоящая более крупная модель, обученная с помощью вычислительных ресурсов xAI, может еще больше продвинуть этот процесс.

Если вы уже используете Cursor, включите Composer 2.5 (по умолчанию Fast) и попробуйте его сегодня — особенно пока действует удвоенное использование. Для всех остальных это еще одна веская причина серьезно присмотреться к Cursor.

Вы уже пробовали Composer 2.5? Поделитесь своим опытом в комментариях — что сработало, что нет, и как он выглядит в вашей среде разработки. Я буду обновлять этот пост, добавляя больше данных от пользователей и результаты последующих тестов.

Composer 2.5 уже доступен. В среде разработки Cursor IDE с включенным по умолчанию быстрым режимом. Акция с удвоенным использованием уже действует — протестируйте ее на своем коде, прежде чем она закончится.

Более 300 моделей ИИ для
OpenClaw и агенты искусственного интеллекта

Сэкономьте 20% на расходах

связаться с нами

Клод Мифос: Самый мощный ИИ, созданный Anthropics, слишком опасен для публичного выпуска – вот почему он меняет кибербезопасность в 2026 году.

Обзор Claude Opus 4.8: Новейшая мощная платформа искусственного интеллекта от Anthropic для программирования, агентов и задач с длительным горизонтом планирования.

Мировые модели в 2026 году: почему Google, NVIDIA, ЛеКун и Фэй-Фэй Ли вкладывают миллиарды в искусственный интеллект, способный понимать физический мир.

Qwen3.7 Max: новый агентный ИИ-монстр от Alibaba – 35-часовая автономность, 1 миллион контекстов и почему это важно в 2026 году.

Что такое Google AI Studio? Полное руководство на 2026 год: функции и цены.

Обновление дизайна поиска Google 2026: режим ИИ и информационные агенты: объяснение.

Что такое Gemini Omni? Модель искусственного интеллекта Google «Создай что угодно из любого входного значения» — подробное объяснение.

Google I/O 2026: Все анонсы — Gemini 3.5, Spark, Omni, Universal Cart и интеллектуальные очки.

Обзор Composer 2.5: самый дешевый агент для программирования от Frontier на сегодняшний день от Cursor — подробный анализ, бенчмарки и тестирование в реальных условиях.

Отчет AI.cc: Руководство для предприятий по унифицированным платформам API для ИИ в 2026 году

Как использовать LangSmith в 2026 году: полное руководство от начинающего до продвинутого пользователя.

Как безопасно использовать агентный ИИ в 2026 году: Полное пошаговое руководство по безопасности.

Как настроить и запустить свою первую рекламную кампанию ChatGPT в OpenAI Ads Manager: полное руководство на 2026 год

ChatGPT Trusted Contact: новая функция безопасности от OpenAI, которая может спасти жизни (и как её настроить)

AICC против OpenRouter: какая платформа API для искусственного интеллекта лучше всего подходит именно вам?

Обзор основных моментов ServiceNow Knowledge 2026: Как предприятия используют ИИ для «автономной работы» в эпоху агентских технологий.

Обзор Composer 2.5: самый дешевый агент для программирования от Frontier на сегодняшний день от Cursor — подробный анализ, бенчмарки и тестирование в реальных условиях.

Обзор Composer 2.5: Курсоры Самый дешевый рубеж Coding Agent Yet — подробный анализ, сравнительные тесты и тестирование в реальных условиях.

Что такое Composer 2.5? Краткий обзор.

Контрольные показатели: насколько это действительно хорошо?

Ценообразование: настоящий прорыв

Практическое тестирование: что я создал с помощью Composer 2.5

Углубленный анализ обучения: чем отличается версия 2.5?

История Kimi K2.5: прозрачность и противоречия

Кому следует использовать Composer 2.5?

Плюсы и минусы

Окончательный вердикт

Более 300 моделей ИИ для OpenClaw и агенты искусственного интеллекта

Более 300 моделей ИИ для
OpenClaw и агенты искусственного интеллекта