Noticias destacadas

Cómo reducir los costos de IA empresarial con el diseño de modelos CALM

09/12/2025 por AICC

Los líderes empresariales que se enfrentan a gastos desorbitados para la implementación de IA pronto podrían encontrar alivio. Si bien la IA generativa ofrece un potencial inmenso, las grandes exigencias computacionales para el entrenamiento y la inferencia han creado un carga financiera y ambiental significativaEsta ineficiencia se debe al "cuello de botella fundamental" de los modelos tradicionales que generan texto token por token.

Según el informe original, "Mantén la calma: Un nuevo diseño de modelo podría solucionar los elevados costes de la IA empresarial", un avance de Tencent AI y la Universidad de Tsinghua Presenta una arquitectura alternativa diseñada para optimizar el procesamiento de grandes volúmenes de datos en sectores como los mercados financieros y las redes de IoT.

Revolucionando la eficiencia de la IA con CALM

La investigación presenta Modelos de lenguaje autorregresivos continuos (CALM)Este enfoque innovador rediseña el proceso de generación prediciendo vectores continuos en lugar de tokens discretos. Al utilizar un autoencoder de alta fidelidad, el sistema comprime múltiples tokens en un solo vector con mayor ancho de banda semántico.

Al procesar grupos de palabras en un solo paso en lugar de secuencialmente, el modelo reduce drásticamente la carga computacional. Entre las principales ventajas de rendimiento se incluyen:

  • reducción del 44% en formación en FLOPs (Operaciones de Punto Flotante).
  • reducción del 34% en operaciones de punto flotante de inferencia.
  • Rendimiento comparable a las líneas base discretas estándar, pero en Costes operativos significativamente menores.

El nuevo conjunto de herramientas para el espacio vectorial continuo

El cambio de un vocabulario estándar a un espacio vectorial infinito requirió el desarrollo de un "Marco de trabajo libre de probabilidad." Dado que las métricas de evaluación tradicionales como la perplejidad ya no son aplicables, el equipo introdujo BrierLM—una métrica novedosa que mide con precisión el rendimiento del modelo sin probabilidades explícitas.

Además, el marco mantiene generación controladaUna característica fundamental para las aplicaciones empresariales. Un nuevo algoritmo de muestreo sin probabilidad permite a las empresas gestionar eficazmente el equilibrio entre la precisión de los resultados y la diversidad creativa.

Impacto estratégico en los costos de la IA empresarial

El marco CALM cambia el enfoque del desarrollo de IA, pasando de simplemente aumentar el número de parámetros a... eficiencia arquitectónicaA medida que los modelos de escalado alcanzan un punto de rendimientos decrecientes, la capacidad de aumentar el ancho de banda semántico por paso generativo se convierte en una ventaja competitiva fundamental.

Para los líderes tecnológicos, la prioridad está cambiando. Al evaluar las hojas de ruta de los proveedores, el enfoque debe ir más allá del tamaño del modelo. sostenibilidad arquitectónicaReducir el consumo de energía y el coste por token permitirá implementar la IA de forma más económica en toda la empresa, desde centros de datos centralizados hasta aplicaciones perimetrales con gran cantidad de datos.


Análisis relacionado: Los indicadores de referencia de IA defectuosos a menudo ponen en riesgo los presupuestos empresariales al enmascarar estas ineficiencias arquitectónicas subyacentes.

Más de 300 modelos de IA para
OpenClaw y agentes de IA

Ahorre un 20% en costos