Ausgewählte Nachrichten

OpenAI Agents SDK Sandbox-Ausführung für bessere KI-Governance und -Sicherheit

18.04.2026 von AICC
OpenAI Agents SDK

OpenAI führt die Sandbox-Ausführung ein. Dies ermöglicht es Governance-Teams in Unternehmen, automatisierte Arbeitsabläufe mit kontrolliertem Risiko einzusetzen. Dieses wichtige Update adressiert langjährige Herausforderungen bei der Überführung von KI-Systemen von Prototypen in Produktionsumgebungen.

🔧 Überwindung architektonischer Herausforderungen bei der KI-Implementierung

Teams, die Systeme vom Prototyp bis zur Serienproduktion überführten, standen vor schwierigen architektonischen Kompromissen hinsichtlich des Ortes ihrer Operationen. Die Verwendung modellagnostischer Frameworks bot zwar anfängliche Flexibilität, konnte aber die Möglichkeiten der Spitzenmodelle nicht voll ausschöpfen. Die SDKs der Modellanbieter blieben zwar näher am zugrundeliegenden Modell, boten aber oft nicht genügend Einblick in die Steuerungsstruktur.

Erschwerend kam hinzu, dass verwaltete Agenten-APIs zwar den Bereitstellungsprozess vereinfachten, aber die Einsatzmöglichkeiten der Systeme und den Zugriff auf sensible Unternehmensdaten stark einschränkten. Um dieses Problem zu lösen, OpenAI führt neue Funktionen im Agents SDK ein.bietet Entwicklern eine standardisierte Infrastruktur mit einem modellnativen Framework und nativer Sandbox-Ausführung.

🏥 Anwendungsbeispiel aus der Praxis: Fallstudie Oscar Health

Die aktualisierte Infrastruktur gleicht die Ausführung an das natürliche Betriebsmuster der zugrunde liegenden Modelle an und verbessert so die Zuverlässigkeit, wenn Aufgaben eine Koordination über verschiedene Systeme hinweg erfordern. Oscar Health liefert ein Beispiel für diese Effizienz im Umgang mit unstrukturierten Daten.

Der Gesundheitsdienstleister testete die neue Infrastruktur, um einen Workflow für klinische Patientenakten zu automatisieren, den ältere Ansätze nicht zuverlässig bewältigen konnten. Das Entwicklerteam benötigte ein automatisiertes System, das korrekte Metadaten extrahiert und gleichzeitig die Grenzen der Patientenkontakte innerhalb komplexer medizinischer Akten korrekt erkennt. Durch die Automatisierung dieses Prozesses konnte der Anbieter Patientenakten schneller auswerten, die Versorgungskoordination beschleunigen und die Patientenerfahrung insgesamt verbessern.

Rachael Burns, leitende Ingenieurin und KI-Technologieleiterin bei Oscar Health, sagte: „Das aktualisierte Agents SDK ermöglichte es uns, einen kritischen Workflow für klinische Patientenakten produktionsreif zu automatisieren, den frühere Ansätze nicht zuverlässig genug bewältigen konnten. Der entscheidende Unterschied lag für uns nicht nur in der Extraktion der richtigen Metadaten, sondern auch im korrekten Verständnis der Grenzen jedes einzelnen Patientenkontakts in langen, komplexen Datensätzen. Dadurch können wir schneller nachvollziehen, was bei jedem Patienten während eines Besuchs geschieht, unsere Mitglieder bei ihren Behandlungsbedürfnissen unterstützen und ihre Erfahrung mit uns verbessern.“

⚙️ Modellnatives Harness optimiert KI-Workflows

Für den Einsatz dieser Systeme müssen Ingenieure die Synchronisierung von Vektordatenbanken verwalten, Halluzinationsrisiken kontrollieren und rechenintensive Zyklen optimieren. Ohne standardisierte Frameworks greifen interne Teams häufig auf die Entwicklung fehleranfälliger, benutzerdefinierter Konnektoren zurück, um diese Arbeitsabläufe zu steuern.

Der neue, modellspezifische Kabelbaum trägt dazu bei, diese Reibung zu verringern. durch die Einführung von konfigurierbarem Speicher, Sandbox-fähiger Orchestrierung und Codex-ähnlichen Dateisystemtools. Entwickler können standardisierte Grundbausteine ​​wie die folgenden integrieren:

  • 📌 Werkzeugnutzung über MCP
  • 📌 Individuelle Anweisungen über AGENTS.md
  • 📌 Dateibearbeitungen mit dem Patch-Anwendungstool
  • 📌 Progressive Offenlegung von Kompetenzen
  • 📌 Codeausführung mithilfe des Shell-Tools

Durch diese Standardisierung können sich die Entwicklungsteams weniger auf die Aktualisierung der Kerninfrastruktur konzentrieren und stattdessen domänenspezifische Logik entwickeln, die dem Unternehmen direkt zugutekommt.

🗂️ Manifestabstraktion für die Unternehmensintegration

Die Integration eines autonomen Programms in eine bestehende Technologieinfrastruktur erfordert ein präzises Routing. Beim Zugriff auf unstrukturierte Daten ist ein autonomer Prozess stark auf Abrufsysteme angewiesen, um relevante Kontextinformationen zu extrahieren.

Um die Integration unterschiedlicher Architekturen zu steuern und den operativen Umfang zu begrenzen, Das SDK führt eine Manifest-Abstraktion ein. Diese Abstraktion standardisiert die Art und Weise, wie Entwickler den Arbeitsbereich beschreiben, und ermöglicht es ihnen, lokale Dateien einzubinden und Ausgabeverzeichnisse zu definieren.

Teams können diese Umgebungen direkt mit führenden Anbietern von Unternehmensspeichern verbinden, darunter:

  • ☁️ AWS S3
  • ☁️ Azure Blob Storage
  • ☁️ Google Cloud-Speicher
  • ☁️ Cloudflare R2

Durch die Einrichtung eines vorhersehbaren Arbeitsbereichs erhält das Modell exakte Parameter, um Eingaben zu speichern, Ausgaben zu schreiben und die Organisation während längerer Betriebszeiten aufrechtzuerhalten. Diese Vorhersagbarkeit verhindert, dass das System ungefilterte Datenbestände abfragt, und beschränkt es auf spezifische, validierte Kontextfenster.

🔒 Erhöhte Sicherheit durch native Sandbox-Ausführung

Das SDK unterstützt nativ die Sandbox-Ausführung.Es bietet eine sofort einsatzbereite Schicht, sodass Programme in kontrollierten Computerumgebungen mit den notwendigen Dateien und Abhängigkeiten ausgeführt werden können. Entwicklerteams müssen diese Ausführungsschicht nicht mehr manuell zusammenstellen.

Sie können ihre eigenen, benutzerdefinierten Sandboxes einsetzen oder die integrierte Unterstützung für Anbieter wie nutzen. Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop und Vercel.

🛡️ Risikominderung und Sicherheitsarchitektur

Die Risikominimierung bleibt die wichtigste Aufgabe für jedes Unternehmen, das autonome Codeausführung einsetzt. Sicherheitsteams müssen davon ausgehen, dass jedes System, das externe Daten liest oder generierten Code ausführt, mit Prompt-Injection-Angriffen und Datenexfiltrationsversuchen konfrontiert werden kann.

OpenAI begegnet dieser Sicherheitsanforderung, indem es die Steuerungsebene von der Rechenschicht trennt. Diese Trennung isoliert die Anmeldeinformationen und hält sie vollständig von den Umgebungen fern, in denen der vom Modell generierte Code ausgeführt wird. Durch die Isolierung der Ausführungsschicht, Ein eingeschleuster Schadbefehl kann weder auf die zentrale Steuerungsebene zugreifen noch primäre API-Schlüssel stehlen., um das gesamte Unternehmensnetzwerk vor lateralen Angriffen zu schützen.

💰 Kostenoptimierung durch Snapshotting

Diese Trennung trägt auch zur Senkung der Rechenkosten bei Systemausfällen bei. Langlaufende Prozesse brechen häufig aufgrund von Netzwerk-Timeouts, Container-Abstürzen oder API-Beschränkungen ab. Benötigt ein komplexer Agent beispielsweise zwanzig Schritte zur Erstellung eines Finanzberichts und scheitert im neunzehnten Schritt, verbraucht die erneute Ausführung der gesamten Sequenz teure Rechenressourcen.

Wenn die Umgebung unter der neuen Architektur abstürzt, bedeutet der Verlust des Sandbox-Containers nicht, dass der gesamte Betrieb verloren geht. Da der Systemzustand externalisiert bleibt, nutzt das SDK integrierte Snapshot- und Rehydrierungsfunktionen. Die Infrastruktur kann den Zustand in einem neuen Container wiederherstellen und genau vom letzten Prüfpunkt aus fortfahren, falls die ursprüngliche Umgebung abläuft oder ausfällt. Die Vermeidung des Neustarts teurer, langlaufender Prozesse führt direkt zu geringeren Ausgaben für Cloud-Computing.

📈 Dynamische Skalierung und Ressourcenzuweisung

Die Skalierung dieser Operationen erfordert eine dynamische Ressourcenzuweisung. Die getrennte Architektur ermöglicht es, folgende Funktionen auszuführen:

  • 🔹 Je nach aktueller Auslastung eine oder mehrere Sandboxes aufrufen.
  • 🔹 Bestimmte Subagenten in isolierte Umgebungen routen
  • 🔹 Aufgaben über mehrere Container hinweg parallelisieren, um schnellere Ausführungszeiten zu erzielen

🚀 Verfügbarkeit und zukünftige Roadmap

Diese neuen Funktionen stehen generell allen Kunden über die API zur Verfügung.Die Preisgestaltung basiert auf Token und der Nutzung der Tools und kommt ohne individuelle Beschaffungsverträge aus. Die neuen Funktionen für Harness und Sandbox stehen zunächst Python-Entwicklern zur Verfügung; die Unterstützung für TypeScript ist für eine spätere Version geplant.

OpenAI plant die Einführung zusätzlicher Funktionen, darunter Code-Modus und SubagentenDie Integration erfolgt sowohl in die Python- als auch in die TypeScript-Bibliotheken. Der Anbieter plant, das Ökosystem im Laufe der Zeit durch die Unterstützung weiterer Sandbox-Anbieter und die Bereitstellung zusätzlicher Methoden für Entwickler zu erweitern, um das SDK direkt in ihre bestehenden internen Systeme zu integrieren.

Mehr als 300 KI-Modelle für
OpenClaw & KI-Agenten

Sparen Sie 20 % der Kosten