Главные новости

Как снизить затраты на ИИ в масштабах предприятия с помощью CALM-моделирования

2025-12-09 от AICC

Руководители предприятий, сталкивающиеся с резким ростом расходов на внедрение ИИ, вскоре могут найти облегчение. Хотя генеративный ИИ обладает огромным потенциалом, высокие вычислительные затраты на обучение и вывод данных создают определенные сложности. значительное финансовое и экологическое бремяЭта неэффективность обусловлена ​​«фундаментальным узким местом» традиционных моделей, которые генерируют текст по одному токену за раз.

Согласно первоначальному отчету, «Сохраняйте спокойствие: новая модель может решить проблему высоких затрат на ИИ в предприятиях».прорыв из Tencent AI и Университет Цинхуа Предлагается альтернативная архитектура, разработанная для оптимизации обработки больших объемов данных в таких секторах, как финансовые рынки и сети Интернета вещей.

Революционизация эффективности ИИ с помощью CALM

Исследование представляет Непрерывные авторегрессивные языковые модели (CALM)Этот инновационный подход перестраивает процесс генерации, предсказывая непрерывные векторы вместо дискретных токенов. Используя высокоточный автокодировщик, система сжимает несколько токенов в один вектор. более высокая семантическая пропускная способность.

Благодаря обработке групп слов за один шаг, а не последовательно, модель значительно снижает вычислительную нагрузку. Ключевые показатели производительности включают:

  • снижение на 44% в процессе обучения работе с FLOPs (операциями с плавающей запятой).
  • снижение на 34% в операциях вывода FLOPs.
  • Производительность сопоставима со стандартными дискретными базовыми показателями, но при этом... значительно более низкие эксплуатационные расходы.

Новый инструментарий для непрерывного векторного пространства

Переход от стандартного словаря к бесконечному векторному пространству потребовал разработки «Безвероятностная модель». Поскольку традиционные метрики оценки, такие как Perplexity, больше не применимы, команда разработала BrierLM—Новая метрика, которая точно измеряет производительность модели без явного указания вероятностей.

Кроме того, данная структура поддерживает контролируемое поколениеЭто важнейшая функция для корпоративных приложений. Новый алгоритм выборки без учета вероятности позволяет компаниям эффективно управлять балансом между точностью результатов и разнообразием творчества.

Стратегическое влияние на затраты предприятий в сфере ИИ

Структура CALM смещает акцент в разработке ИИ с простого увеличения количества параметров на архитектурная эффективностьПоскольку масштабируемые модели достигают точки убывающей отдачи, способность увеличивать семантическую пропускную способность на каждом этапе генерации становится критически важным конкурентным преимуществом.

Для руководителей технологических компаний приоритеты меняются. При оценке планов развития поставщиков необходимо сместить акцент с размера модели на архитектурная устойчивостьСнижение энергопотребления и стоимости токена позволит более экономично внедрять ИИ в масштабах всего предприятия, от централизованных центров обработки данных до ресурсоемких периферийных приложений.


Соответствующий анализ: Несовершенные тесты производительности ИИ часто ставят под угрозу корпоративные бюджеты, маскируя эти скрытые архитектурные недостатки.