专题新闻

OpenAI Agents SDK 沙​​箱执行,助力提升 AI 治理和安全性

2026-04-18 由 AICC 提供
OpenAI Agents SDK

OpenAI 正在引入沙箱执行机制 这使得企业治理团队能够以可控的风险部署自动化工作流程。此次重大更新解决了人工智能系统从原型环境迁移到生产环境过程中长期存在的挑战。

🔧 克服人工智能部署中的架构挑战

将系统从原型推向生产阶段的团队在操作发生的位置方面面临着艰难的架构妥协。 使用与模型无关的框架虽然提供了最初的灵活性,但未能充分利用前沿模型的功能。 模型提供程序 SDK 与底层模型保持着更紧密的联系,但通常缺乏对控制框架的足够可见性。

更复杂的是,托管代理 API 虽然简化了部署流程,但却严重限制了系统的运行范围以及它们访问敏感企业数据的方式。为了解决这个问题, OpenAI 正在为 Agents SDK 引入新功能。为开发者提供标准化的基础设施,包括原生模型框架和原生沙箱执行。

🏥 实际应用:Oscar Health 案例研究

更新后的基础设施使执行与底层模型的自然运行模式保持一致,从而在需要跨不同系统协调任务时提高可靠性。 Oscar Health 就是一个处理非结构化数据时体现这种效率的例子。

该医疗机构测试了新的基础设施,以实现临床记录工作流程的自动化,而旧方法无法可靠地处理这一流程。工程团队要求自动化系统能够提取正确的元数据,同时准确理解复杂医疗档案中患者就诊的界限。通过自动化这一流程,医疗机构可​​以更快地解析患者病史,加快护理协调,并改善患者的整体体验。

Oscar Health 的高级工程师兼人工智能技术主管 Rachael Burns 表示: “更新后的 Agents SDK 使我们能够实现关键临床记录工作流程的自动化,而之前的方法无法可靠地处理这一流程,这在生产环境中是切实可行的。对我们而言,区别不仅在于提取正确的元数据,还在于能够正确理解冗长复杂记录中每次就诊的界限。因此,我们可以更快地了解每位患者在特定就诊中的情况,从而更好地满足他们的护理需求,并改善他们的就医体验。”

⚙️ Model-Native Harness 优化 AI 工作流程

为了部署这些系统,工程师必须管理向量数据库同步、控制幻觉风险并优化昂贵的计算周期。由于缺乏标准框架,内部团队通常只能构建脆弱的自定义连接器来管理这些工作流程。

新型的原生模型线束有助于缓解这种摩擦 通过引入可配置内存、沙箱感知编排和类似 Codex 的文件系统工具,开发人员可以集成以下标准化原语:

  • 📌 通过 MCP 使用工具
  • 📌 通过 AGENTS.md 提供自定义说明
  • 📌 使用应用补丁工具编辑文件
  • 📌 通过技能逐步披露
  • 📌 使用 shell 工具执行代码

这种标准化使得工程团队能够减少更新核心基础设施的时间,专注于构建直接惠及业务的特定领域逻辑。

🗂️ 企业集成清单抽象

将自主程序集成到传统技术栈中需要精确的路由。当自主进程访问非结构化数据时,它严重依赖检索系统来提取相关的上下文信息。

为了管理不同架构的集成并限制操作范围, SDK引入了清单抽象层。 这种抽象规范了开发者描述工作区的方式,允许他们挂载本地文件并定义输出目录。

团队可以将这些环境直接连接到主要的企业存储提供商,包括:

  • ☁️ AWS S3
  • ☁️ Azure Blob 存储
  • ☁️ Google 云存储
  • ☁️ Cloudflare R2

建立可预测的工作空间,能够为模型提供精确的参数,使其能够确定输入的位置、输出的写入位置,并在长时间运行期间保持数据结构的有序性。这种可预测性能够防止系统查询未经筛选的数据湖,而是将其限制在特定的、经过验证的上下文窗口中。

🔒 通过原生沙箱执行增强安全性

SDK 原生支持沙箱执行它提供了一个开箱即用的执行层,使程序能够在包含必要文件和依赖项的受控计算机环境中运行。工程团队不再需要手动组装此执行层。

他们可以部署自己的自定义沙箱,也可以利用内置的对提供商的支持,例如 Blaxel、Cloudflare、Daytona、E2B、Modal、Runloop 和 Vercel。

🛡️风险缓解和安全架构

对于任何部署自主代码执行的企业而言,风险缓解仍然是首要考虑因素。安全团队必须假定任何读取外部数据或执行生成代码的系统都将面临提示注入攻击和数据窃取尝试。

OpenAI 通过将控制层与计算层分离来满足这一安全要求。 这种分离方式将凭证隔离,使其完全脱离模型生成的代码执行的环境。通过隔离执行层, 注入的恶意命令无法访问中央控制平面或窃取主 API 密钥。保护更广泛的企业网络免受横向移动攻击。

💰 通过快照实现成本优化

这种分离也解决了系统故障带来的计算成本问题。长时间运行的任务经常会因为网络超时、容器崩溃或 API 限制而中途失败。例如,如果一个复杂的代理需要 20 个步骤来编译一份财务报告,但在第 19 个步骤失败,那么重新运行整个序列会消耗大量的计算资源。

如果新架构下的环境崩溃,丢失沙箱容器并不意味着丢失整个运行。 由于系统状态保持外部化,SDK 利用内置的快照和重新水合功能。 如果原始环境过期或发生故障,该基础设施可以在一个全新的容器中恢复状态,并从最后一个检查点完全恢复。 避免重启昂贵且长时间运行的进程,可以直接降低云计算支出。

📈动态扩展和资源分配

扩展这些操作需要动态资源分配。这种分离式架构允许运行执行以下操作:

  • 🔹 根据当前负载调用一个或多个沙箱
  • 🔹 将特定子代理路由到隔离环境中
  • 🔹 跨多个容器并行执行任务,以加快执行速度

🚀 可用性和未来路线图

这些新功能通常可通过 API 向所有客户开放。该方案采用基于Tokens和工具使用量的标准定价模式,无需定制采购合同。新的框架和沙箱功能首先面向 Python 开发人员推出,TypeScript 支持计划在未来的版本中推出。

OpenAI计划增加更多功能,包括 代码模式和子代理同时支持 Python 和 TypeScript 库。供应商计划通过支持更多沙箱提供商,并为开发者提供更多将 SDK 直接集成到现有内部系统的方法,逐步扩展其生态系统。

300 多个 AI 模型
OpenClaw 和人工智能代理

节省20%的费用