如何利用 CALM 模型设计降低企业 AI 成本
2025-12-09 由 AICC 提供
企业领导者们正面临着人工智能部署成本飙升的困境,或许很快就能找到缓解之道。尽管生成式人工智能潜力巨大,但训练和推理所需的大量计算资源却造成了巨大的成本压力。 巨大的经济和环境负担这种低效源于传统模型的“根本瓶颈”,即一次只能生成一个词元的文本。
根据原始报告, “保持冷静:新模型设计或可解决企业人工智能成本过高的问题”这是一项突破 腾讯人工智能与清华大学 引入了一种替代架构,旨在简化金融市场和物联网网络等行业的海量数据处理。
CALM 革新人工智能效率
该研究呈现了…… 连续自回归语言模型(CALM)这种创新方法通过预测连续向量而非离散词元来重新设计生成过程。通过使用高保真自编码器,该系统将多个词元压缩成一个向量。 更高的语义带宽。
该模型通过一次性处理多组词语而非顺序处理,直接大幅降低了计算量。主要性能亮点包括:
- 减少44% 在训练中执行 FLOPs(浮点运算)。
- 减少34% 推理浮点运算次数。
- 性能与标准离散基准相当,但 运营成本显著降低。
连续向量空间的新工具包
从标准词汇表过渡到无限向量空间需要开发一种 “无概率框架”。 由于像困惑度这样的传统评估指标不再适用,团队引入了 BrierLM—一种无需明确概率即可准确衡量模型性能的新型指标。
此外,该框架还保持 受控发电这是企业应用的一项关键功能。一种全新的无似然抽样算法使企业能够有效地平衡输出精度和创意多样性。
对企业人工智能成本的战略影响
CALM框架将人工智能开发的重点从简单地增加参数数量转移到 建筑效率随着模型规模的扩大达到收益递减点,提高每个生成步骤的语义带宽的能力成为一项关键的竞争优势。
对于技术领导者而言,优先事项正在发生转变。在评估供应商路线图时,关注点必须从产品规模转移到…… 建筑可持续性降低每个令牌的能耗和成本,将使人工智能能够以更经济的方式部署到整个企业,从集中式数据中心到数据密集型边缘应用。
相关分析: 有缺陷的人工智能基准测试往往会掩盖这些潜在的架构效率低下问题,从而使企业预算面临风险。


登录










