专题新闻

亚太企业将人工智能基础设施转移到边缘端以降低推理成本

2025-11-21 由 AICC 提供

人工智能领域的支出 亚太地区 人工智能领域正蓬勃发展,但许多企业却难以实现切实的投资回报。主要障碍在于基础设施:现有系统通常并非为现代人工智能推理所需的速度或规模而设计。行业研究表明,由于这些架构限制,对全新一代人工智能(GenAI)工具的大量投资往往难以达到预期目标。

这一绩效差距凸显了以下方面的关键作用: 人工智能基础设施 在成本管理和部署规模扩展方面,为了解决这个问题, 聪明的 已推出其 推理云, 供电 NVIDIA Blackwell GPU旨在将决策权下放给用户,以消除延迟并减少开销。

弥合实验与生产之间的差距

杰伊·詹金斯Akamai云计算首席技术官在一次关于“亚太企业随着推理成本上升而将AI基础设施迁移到边缘”这一趋势的采访中指出,许多项目失败的原因在于企业低估了从试点到生产的过渡成本。高昂的基础设施费用和高延迟常常阻碍项目进展。

虽然集中式云是标准配置,但随着使用量的增长,其成本会变得非常高昂,尤其是在远离主要数据中心的地区。 “人工智能的强大程度取决于它所运行的基础设施。” Jenkins 强调,多云复杂性和数据合规性进一步加剧了形势的复杂性。

从人工智能训练到实时推理的转变

随着人工智能在亚太地区的应用日趋成熟,关注点正从偶尔进行模型训练转向 连续推理这种日常运营需求消耗了最多的计算能力,尤其是在语言、视觉和多模态模型在不同市场推广应用的情况下。集中式系统原本并非为这种快速响应而设计,如今正成为主要的瓶颈。

边缘基础设施 优化方式如下:

  • 缩短数据距离: 缩短数据传输路径,以确保模型更快响应。
  • 降低成本: 避免因在远距离云枢纽之间路由数据而产生的高额出口费用。
  • 实现实时行动: 支持需要毫秒级决策的物理人工智能系统,例如机器人和自主机器。

行业应用:零售、金融及其他

对延迟高度敏感的行业正引领着向边缘化发展的潮流:

  • 零售与电子商务: 本地化推理支持个性化推荐和多模态搜索,防止因速度慢而导致用户放弃搜索。
  • 金融: 欺诈检测和支付审批依赖于快速的人工智能决策链。在本地处理数据有助于企业在保持速度的同时,确保数据符合监管要求。

构建未来:智能体人工智能与安全

人工智能的下一阶段包括 人工智能代理能够自主做出决策序列的系统。这需要…… “人工智能配送网络” 它将推理过程分布到数千个边缘位置。这种分布式方法不仅提高了性能,而且还简化了…… 数据治理 亚太地区有 50% 的企业目前正努力应对各地不同的监管规定。

随着推理向边缘移动, 安全 仍然至关重要。在每个站点实施零信任控制并保护 API 管道,可确保弹性不会以牺牲安全性为代价。对于 2025 年及以后的企业而言,向边缘迁移不再是可选项,而是实现可扩展、经济高效的 AI 的先决条件。