Как технический блогер, который провел последние 48 часов, тестируя Composer 2.5 в рамках множества реальных проектов, я представляю вам всесторонний обзор, основанный на практическом опыте. Мы рассмотрим бенчмарки, детали обучения, цены, опыт реальных пользователей, сравнения с Claude Opus 4.7 и GPT-5.5, а также выясним, станет ли эта модель тем инструментом, который наконец-то превратит ИИ-агентов в повседневную работу профессиональных разработчиков программного обеспечения.

Что такое Composer 2.5? Краткий обзор.
Серия программ Composer от Cursor специально разработана для агентное кодирование внутри среды разработки Cursor IDE (и ее развивающегося интерфейса Glass). В отличие от моделей общего назначения, доступ к которым осуществляется через API, модели Composer оптимизированы для среды Cursor от начала до конца: редактирование нескольких файлов, использование терминальных инструментов, навигация по кодовой базе, итеративная отладка и задачи разработки программного обеспечения с длительным горизонтом планирования.
Композитор 2.5 напрямую основан на том же самом универсальном алгоритме Moonshot AI. Как K2.5 Контрольная точка, использованная для Composer 2. Cursor сообщает, что на постобучение и обучение с подкреплением (RL) тратится около 85% общего вычислительного бюджета, включая в 25 раз больше синтетических задач, чем в предыдущей версии.
Это не просто тонкая настройка. Здесь используются новые методы, такие как целевое обучение с подкреплением с текстовой обратной связью, усовершенствованная генерация синтетических данных и улучшения инфраструктуры для обучения методом смешанных групп экспертов (MoE).

Контрольные показатели: насколько это действительно хорошо?
Компания Cursor опубликовала впечатляющие результаты продаж Composer 2.5:
- SWE-Bench Multilingual: 79,8% — соответствует показателю Opus 4.7 от Anthropic.
- CursorBench v3.1: 63,2% — конкурентоспособен по сравнению с лучшими моделями передовых технологий.
- Терминальный стенд 2.0Показатели улучшились, но всё ещё отстают от GPT-5.5 (сообщается о показателе около 69,3% против более высокого показателя для GPT).
Сравнительная таблица (приблизительные данные из открытых источников):
| Бенчмарк | Композитор 2.5 | Опус 4.7 | ГПТ-5.5 | Победитель |
|---|---|---|---|---|
| SWE-Bench Multilingual | 79,8% | ~80% | ~78-80% | Галстук |
| CursorBench v3.1 | 63,2% | ~63-65% | ~59-63% | Ничья / Небольшое произведение искусства |
| Терминальный стенд 2.0 | ~69,3% | ~69,4% | 82,7% | ГПТ-5.5 |
Эти результаты впечатляют, особенно с учетом стоимости. Общедоступные бенчмарки, такие как SWE-Bench, проверяют реальное решение проблем GitHub на разных языках программирования, в то время как CursorBench использует реальные внутренние задачи разработки курсоров (неоднозначные подсказки, большие изменения в нескольких файлах).
Главный выводComposer 2.5 достигает паритета по ключевым показателям в разработке программного обеспечения, но при этом стоит значительно дешевле. Он не является повсеместно превосходящим конкурентов, но обеспечивает производительность на уровне передовых технологий там, где это важно для большинства рабочих процессов разработчиков.
Ценообразование: настоящий прорыв
Стандарт
0,50 доллара
на каждый входной токен M
Стандартный вывод
2,50 доллара
на каждый выходной токен M
Быстрый (по умолчанию)
3,00 доллара
за 1 м входного тока / 15,00 $ выходного тока
Это по-прежнему значительно дешевле, чем у конкурентов. Для сравнения, тарифные планы Claude Opus часто стоят от 5 до 25 долларов в месяц и выше, а GPT-5.5 Pro стоит примерно столько же. Кроме того, Cursor удвоил лимит использования в первую неделю после запуска.
По оценкам аналитиков, стоимость выполнения многих типичных инженерных задач в Composer 2.5 составляет менее 1 доллара, в то время как аналогичные по качеству решения от Opus или GPT стоят несколько долларов. Это создает мощный эффект Парето: почти высочайший уровень интеллекта при в 10 раз меньшей стоимости.
Практическое тестирование: что я создал с помощью Composer 2.5
Я протестировал Composer 2.5 на трёх реальных проектах:
- Полнофункциональная реализация стека (Next.js 15 + TypeScript + Supabase + Tailwind)
- Задача: Разработать приложение для управления задачами на основе искусственного интеллекта с возможностью совместной работы в режиме реального времени, функцией перетаскивания элементов на доске Kanban и экспортом в PDF.
- Результат: Composer 2.5 отлично справился с многофайловой генерацией шаблонов. Он создал корректные политики Supabase RLS, реализовал оптимистичные обновления пользовательского интерфейса и настроил чистую библиотеку компонентов shadcn/ui. В большинстве файлов генерация прошла успешно с первого раза. Для обработки крайних случаев аутентификации потребовались незначительные доработки. Скорость в быстром режиме была «умопомрачительной» — генерация происходила в 3-5 раз быстрее, чем в Opus при выполнении аналогичных задач.
- Масштабная рефакторизация кодовой базы (Устаревший монолит на Python/FastAPI, ~120 тыс. строк кода)
- Задача: Перенести аутентификацию с пользовательского JWT на Auth0, обновить более 40 файлов, добавить комплексные тесты.
- Результат: Высокая производительность. Программа корректно определяла цепочки зависимостей и вносила согласованные изменения во все модули. Иногда требовались небольшие корректировки утверждений в тестах, но в целом система хорошо восстанавливалась. Обработка длинных контекстов (более 200 000 токенов) показала себя надежной. Улучшена «калибровка усилий» по сравнению с предыдущими версиями — программа не вносила лишних изменений в несвязанные файлы.
- Рабочий процесс терминала и агента (Отладка микросервисов в Docker)
- Задача: Диагностировать и устранить проблему с сетью в системе из 5 сервисов, использующей Redis, Postgres и бэкенд на языке Go.
- Результат: Отличное использование инструмента и итеративная отладка. Предложенный подход.
docker composeКоманды, интеллектуальный анализ журналов и быстрая итерация. Здесь проявились улучшения в Terminal-Bench, хотя GPT-5.5 по-прежнему кажется более эффективным для очень сложной оркестрации командной оболочки.
Субъективные впечатления:
- Скорость и отзывчивостьБыстрый вариант — это просто находка. Низкая задержка меняет рабочий процесс с «ожидания ИИ» на «сотрудничество в диалоге».
- Инструкция следующаяЗаметно лучше справляется со сложными, многоэтапными запросами. Меньше ложных срабатываний при вызове инструментов.
- Стиль общенияБолее спокойный, естественный. Меньше наигранной уверенности, лучше умеет говорить: «Мне нужна дополнительная информация».
- Надежность при выполнении длительных задачСамое большое преимущество. Оно позволяет лучше сохранять концентрацию внимания на протяжении более 50 ходов.
Углубленный анализ обучения: чем отличается версия 2.5?
Технический подход Cursor заслуживает особого внимания:
- Целенаправленное обучение с подкреплением с текстовой обратной связью: Решает проблему распределения кредитов в длительных развертываниях путем вставки локализованных подсказок для конкретных ошибок (например, некорректных вызовов инструментов). Это улучшает поведение без лишних глобальных вознаграждений.
- Массивные синтетические данные: В 25 раз больше задач, включая «удаление функций», когда агент должен заново реализовать удаленную функциональность, сохраняя при этом корректность тестов. Это порождает сложные, проверяемые проблемы, основанные на реальном коде.
- Инфраструктурные победыОптимизатор Sharded Muon, двухсеточный HSDP для MoE, асинхронные конвейеры RL — обеспечивающие эффективное масштабирование на больших кластерах (включая частичное обучение на Colossus 2).
Они уже сотрудничают с xAI/SpaceXAI над созданием гораздо более масштабной модели с нуля, использующей в 10 раз больше вычислительных ресурсов.
История Kimi K2.5: прозрачность и противоречия
Как и Composer 2, версия 2.5 использует Kimi K2.5 от Moonshot в качестве базовой точки отсчета, поверх которой накладывается значительная поддержка, специфичная для Cursor. Первоначальные запуски вызвали споры об авторстве, но с тех пор Cursor стал более открытым, а Moonshot признала наличие коммерческих партнерств через такие платформы, как Fireworks.
Этот гибридный подход (сильная открытая база + обучение с подкреплением, специфичное для предметной области) становится все более распространенным и эффективным. В результате получается продукт, идеально подходящий для рабочих процессов агентов Cursor.
Кому следует использовать Composer 2.5?
Да — Переключитесь или расставьте приоритеты, если:
- Вам нужно максимальное количество итераций на доллар.
- Ваш рабочий процесс включает в себя множество агентских, многофайловых или длительных задач.
- Вы цените скорость и приятное сотрудничество больше, чем абсолютную точность в решении самых сложных задач.
- У вас ограниченный командный бюджет (значительная экономия средств прекрасно масштабируется).
Используйте Opus/GPT для:
- Сверхсложная новая архитектура или рассуждения исследовательского уровня.
- Задачи, где критически важно владение командной оболочкой типа Terminal-Bench.
- Максимальный успех с первой попытки при решении неоднозначных задач с высокими ставками (хотя разрыв быстро сокращается).
Многие разработчики сообщают об использовании Composer 2.5 в качестве основной рабочей среды, перенаправляя наиболее сложные подзадачи на платные модели — это разумная гибридная стратегия.
Плюсы и минусы
Преимущества
- Невероятное соотношение цены и качества.
- Режим "Молниеносная скорость".
- Улучшена надежность и поведение при выполнении длительных задач.
- Отличное знание редактирования нескольких файлов и кодовой базы.
- Акция с удвоенным использованием (проверьте текущие лимиты).
Ограничения
- По-прежнему немного отстаёт в некоторых тестах производительности терминала/агента.
- Доступно только через IDE (публичный API пока отсутствует).
- Иногда возникает необходимость в дополнительных разъяснениях по совершенно новым или нестандартным логическим задачам.
- Вопросы происхождения базовой модели продолжают вызывать дискуссии в некоторых сообществах.
Окончательный вердикт
9.2/10
Для большинства разработчиков
Композитор 2.5 Это самое убедительное на сегодняшний день доказательство того, что специализированные, эффективно постобученные модели могут давать результаты на переднем крае технологий по цене обычного товара. Она не превосходит повсеместно Claude Opus 4.7 или GPT-5.5, но достаточно близка к ним по показателям, важным для 80% реальной работы, при этом обходится значительно дешевле и кажется быстрее в процессе работы.
Для разработчиков-одиночек, стартапов и команд, занимающихся итеративной разработкой продуктов, это потенциально может стать движущей силой, меняющей экономику инженерных решений с использованием ИИ. Предстоящая более крупная модель, обученная с помощью вычислительных ресурсов xAI, может еще больше продвинуть этот процесс.
Если вы уже используете Cursor, включите Composer 2.5 (по умолчанию Fast) и попробуйте его сегодня — особенно пока действует удвоенное использование. Для всех остальных это еще одна веская причина серьезно присмотреться к Cursor.
Вы уже пробовали Composer 2.5? Поделитесь своим опытом в комментариях — что сработало, что нет, и как он выглядит в вашей среде разработки. Я буду обновлять этот пост, добавляя больше данных от пользователей и результаты последующих тестов.


Авторизоваться














