精选博客

智能体 + 技能:可扩展人工智能的新架构

2026年1月29日

智能体 + 技能:可扩展人工智能的新架构

AICC | 更新日期:2026年1月 | 人工智能架构
人工智能代理与技能概念图

在围绕……的炒作之前 模型上下文协议(MCP) 趁着风头还没过去,Anthropic 又推出了一款爆款产品: 特工技能这一发展迫使我们重新思考人工智能系统的基本架构。

我们正超越“它是智能体还是工具?”这种简单的二元对立,走向更为细致的理解。智能体是具有完整决策能力的实体,它们拥有系统提示、工具访问权限、支持模型(例如 Claude、ChatGPT 等)以及智能体循环,使其能够协调工作流程并管理状态。相比之下,新的智能体技能是模块化的、声明式的专业知识包——将组织化的程序知识打包成可重用的单元,智能体可以根据需要逐步加载这些单元。

这就引出了一个有趣且根本性的架构问题:什么是代理,什么是技能?这种选择对范围管理、上下文窗口可靠性、可扩展性和可评估性都有着切实的影响。答案并非二选一,而是…… 具备技能的代理人

为什么经纪人仅靠提示无法扩大规模

早期的智能体系统会遇到一些可以预见的瓶颈。团队会针对每个用例构建专门的智能体:客服智能体、编码智能体、研究智能体等等。当这些智能体需要新功能时,开发人员要么更新系统提示,要么创建一个全新的智能体。这种方法对于简单的任务来说尚可,但规模扩大后很快就会变得难以管理。

这种模式在各个组织中反复出现:新的特殊情况需要迅速修改,虽然有时能解决问题,但往往会在其他地方引发倒退。智能体缺乏从执行过程中学习或跨上下文迁移知识的机制。上下文窗口充斥着日益复杂的指令或矛盾之处,导致智能体分心、困惑,或无法对相互冲突的信息进行推理。

我们过去普遍认为,智能体在不同领域会因其提示和工具的不同而呈现出截然不同的面貌。但实际上,模型与智能体之间的关系比我们想象的更具普适性。这一认识促使我们构建了一种新的模型:一个通用智能体,配备一系列专业化的功能库。

为什么经纪人需要技能

技能使我们能够在不改变架构的情况下迭代领域专业知识。它们主要以声明式的方式呈现,这意味着领域专家无需修改代理逻辑即可贡献功能。安全团队可以将其合规性工作流程打包成一个技能。数据工程团队可以将其 ETL 最佳实践编码。这些贡献无需触及代理的核心系统提示或决策循环。

当智能体遇到新的场景时,技能可以清晰地划分责任边界。团队可以针对一个领域更新技能,而不会导致其他领域出现问题。技能可以进行版本控制、独立测试,并根据遥测数据进行改进,所有这些都无需像系统提示工程那样承受脆弱性。

技能使…… 渐进加载这种方法通过逐步引入资源来帮助解决上下文膨胀问题。任何使用代理的人可能都经历过上下文窗口膨胀的情况,而2025年的研究表明,上下文窗口过载会导致一些意想不到的故障模式。

渐进式加载解决了这个问题:在运行时,智能体只能看到技能的元数据(名称和描述)。只有当智能体判断某个技能与当前任务相关时,才会加载完整的技能内容。这意味着技能中包含的上下文信息量可以无限增长,而不会影响智能体的推理能力。

何时构建代理或技能

那么,该如何抉择呢?请参考以下对比来指导您的建筑设计决策:

当您需要时,构建代理... 需要时即可培养技能……
利用多步骤决策树实现完整的工作流程编排。 可跨情境应用的可重用程序性知识。
复杂操作中的状态管理。 来自非开发人员的领域专业知识贡献。
通过系统评估进行质量控制。 通过选择性加载来保护上下文窗口。
防止滥用的范围界限。 能够独立演进的能力。

许多现有的智能体——实际上是带有工具访问权限的结构化提示——只需稍作修改即可转化为技能。但有些应用场景确实需要完整智能体所提供的控制、范围管理和可评估性。

真实案例:ClickHouse 迁移

我们在建造过程中也面临着同样的建筑设计难题。 clickhouse.build是一款智能代码助手,可帮助开发人员将分析工作负载从 Postgres 迁移到 ClickHouse。我们的命令行界面 (CLI) 最初​​提供了四个专用代理:一个用于识别代码库中分析查询的扫描器、一个用于设置 ClickPipes 的数据迁移器、一个用于添加 ClickHouse 接口并保持向后兼容性的代码迁移器,以及一个用于验证更改的 QA 代理。

最初,我们的目标范围刻意缩小:仅限于 Postgres 查询和 TypeScript 代码库。这种针对性虽然保证了代理的性能,但也限制了它们的适用范围。2025 年 10 月,Anthropic 发布 Agent Skills 时,我们看到了一个在不牺牲质量的前提下,突破这一狭窄范围的机会。

通过引入技能,我们现在可以支持其他在线事务处理 (OLTP) 数据源,例如 MySQL 和 MongoDB、Python 和 Java 代码库,以及更灵活的 QA 工作流程,而无需重写核心代理。语言客户端维护人员可以为各自的领域(Golang、Java、Python)开发技能,而无需修改代理编排逻辑。我们可以围绕特定技能构建评估机制,并独立地对其进行改进。

经纪人需要执照才能熟练操作

未来 人工智能代理 这不是在代理和技能之间做选择,而是选择在恰当的时间配备恰当技能的代理;或者说,选择拥有“技能授权”的代理。代理负责协调、维护范围并通过评估确保质量。技能则整合专业知识、保护上下文窗口并支持领域专家的贡献。

这种架构已经重塑了像 clickhouse.build 这样的生产系统,并且随着技能与 MCP 一起成为开放标准,它有望成为构建可扩展、可维护的 AI 系统的默认方法。