Notícias em destaque

Como reduzir os custos de IA empresarial com o design de modelos CALM

2025-12-09 por AICC

Líderes empresariais que enfrentam custos exorbitantes com a implementação de IA podem em breve encontrar alívio. Embora a IA generativa ofereça um potencial imenso, as elevadas demandas computacionais para treinamento e inferência criaram um desafio. ônus financeiro e ambiental significativoEssa ineficiência decorre do "gargalo fundamental" dos modelos tradicionais que geram texto um token por vez.

De acordo com o relatório original, "Mantenha a calma: um novo modelo de design pode solucionar os altos custos da IA ​​nas empresas", um avanço de Tencent AI e Universidade de Tsinghua Apresenta uma arquitetura alternativa projetada para otimizar o processamento de grandes volumes de dados em setores como mercados financeiros e redes de IoT.

Revolucionando a eficiência da IA ​​com o CALM

A pesquisa apresenta Modelos de linguagem autorregressivos contínuos (CALM)Essa abordagem inovadora reformula o processo de geração, prevendo vetores contínuos em vez de tokens discretos. Ao usar um autoencoder de alta fidelidade, o sistema comprime múltiplos tokens em um único vetor com maior largura de banda semântica.

Ao processar grupos de palavras em uma única etapa, em vez de sequencialmente, o modelo reduz drasticamente a carga computacional. Os principais destaques de desempenho incluem:

  • Redução de 44% no treinamento de FLOPs (Operações de Ponto Flutuante).
  • Redução de 34% em operações de ponto flutuante de inferência.
  • Desempenho comparável às linhas de base discretas padrão, mas em custos operacionais significativamente menores.

O novo conjunto de ferramentas para espaço vetorial contínuo

A transição de um vocabulário padrão para um espaço vetorial infinito exigiu o desenvolvimento de um "Estrutura livre de probabilidades." Como as métricas de avaliação tradicionais, como a Perplexidade, não se aplicam mais, a equipe introduziu... BrierLM—uma nova métrica que mede com precisão o desempenho do modelo sem probabilidades explícitas.

Além disso, a estrutura mantém geração controlada, um recurso vital para aplicações empresariais. Um novo algoritmo de amostragem livre de probabilidade permite que as empresas gerenciem o equilíbrio entre a precisão da produção e a diversidade criativa de forma eficaz.

Impacto estratégico nos custos de IA empresarial

A estrutura CALM muda o foco do desenvolvimento de IA, deixando de ser simplesmente o aumento do número de parâmetros para... eficiência arquitetônicaÀ medida que os modelos de escalabilidade atingem um ponto de retornos decrescentes, a capacidade de aumentar a largura de banda semântica por etapa generativa torna-se uma vantagem competitiva crucial.

Para os líderes de tecnologia, a prioridade está mudando. Ao avaliar os roteiros dos fornecedores, o foco deve ir além do tamanho do modelo para sustentabilidade arquitetônicaA redução do consumo de energia e do custo por token permitirá que a IA seja implementada de forma mais econômica em toda a empresa, desde centros de dados centralizados até aplicações de ponta com grande volume de dados.


Análise relacionada: Critérios de avaliação de IA falhos frequentemente colocam em risco os orçamentos empresariais, mascarando essas ineficiências arquitetônicas subjacentes.