Anthropisches KI-Modell nach Entdeckung Tausender Sicherheitslücken geheim gehalten

Das leistungsfähigste KI-Modell von Anthropic hat bereits festgestellt Tausende von Schwachstellen in der KI-Cybersicherheit auf allen gängigen Betriebssystemen und Webbrowsern. Die Reaktion des Unternehmens bestand nicht darin, die Daten zu veröffentlichen, sondern sie stillschweigend den Organisationen zu übergeben, die für den Betrieb des Internets verantwortlich sind.
Dieses Modell ist Claude Mythos Vorschauund die Initiative heißt Projekt GlasswingDie
Zu den Launch-Partnern gehören: Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, die Linux Foundation, Microsoft, Nvidia und Palo Alto NetworksDie
Über diese Kerngruppe hinaus hat Anthropic den Zugang auf über 100 Personen erweitert. 40 weitere Organisationen die kritische Softwareinfrastruktur aufbauen oder warten. Anthropic verpflichtet sich zu bis zu Nutzungsgutschriften in Höhe von 100 Millionen US-Dollar für Mythos Preview im Rahmen der gesamten Bemühungen, zusammen mit 4 Millionen US-Dollar an direkten Spenden an Open-Source-Sicherheitsorganisationen.
🔍 Ein Modell, das seine eigenen Maßstäbe übertroffen hat
Mythos Preview wurde nicht speziell für Cybersicherheitsaufgaben entwickelt. Laut Anthropic ergaben sich die Fähigkeiten „als Folge allgemeiner Verbesserungen in Code, Schlussfolgerungen und Autonomie“, und dieselben Verbesserungen, die das Modell beim Schließen von Schwachstellen besser machen, verbessern auch deren Ausnutzung.
Dieser letzte Teil ist wichtig. Mythos Preview hat verbessert insofern es die bestehenden Sicherheitsstandards weitgehend ausschöpft, ist Anthropic gezwungen, seinen Fokus auf neuartige Aufgaben in der realen Welt zu verlagern – insbesondere Zero-Day-SchwachstellenDiese Mängel waren den Softwareentwicklern zuvor unbekannt.
Zu den Ergebnissen gehörte: ein 27 Jahre alter Fehler in OpenBSD, ein Betriebssystem, das für seine hohe Sicherheit bekannt ist. In einem anderen Fall identifizierte und nutzte das Modell vollautomatisch eine Sicherheitslücke aus. 17 Jahre alte Sicherheitslücke in FreeBSD ermöglicht die Ausführung von Remote-Code–CVE-2026-4747– Dadurch kann ein nicht authentifizierter Benutzer von überall im Internet die vollständige Kontrolle über einen Server erlangen, auf dem NFS läuft. Nach dem ersten Hinweis zur Fehlersuche war kein Mensch mehr an der Entdeckung oder Ausnutzung beteiligt.
Nicholas Carlini vom Forschungsteam von Anthropic beschrieb die Fähigkeit des Modells, Schwachstellen miteinander zu verknüpfen: „Dieses Modell kann aus drei, vier oder manchmal sogar fünf Sicherheitslücken Exploits generieren, die in ihrer Gesamtheit zu einem äußerst komplexen Endergebnis führen. Ich habe in den letzten paar Wochen mehr Fehler gefunden als im Rest meines Lebens zusammen.“
🚫 Warum wird es nicht veröffentlicht?
„Aufgrund der Cybersicherheitslücken planen wir nicht, Claude Mythos Preview allgemein zugänglich zu machen.“ Newton Cheng, Frontier Red Team Cyber Lead bei Anthropic, sagte.
„Angesichts des rasanten Fortschritts im Bereich der KI wird es nicht lange dauern, bis sich solche Fähigkeiten weit verbreiten, möglicherweise auch über Akteure hinaus, die sich zu deren sicherem Einsatz verpflichtet haben. Die Folgen – für Wirtschaft, öffentliche Sicherheit und nationale Sicherheit – könnten gravierend sein.“
Dies ist keine hypothetische Annahme. Anthropic hatte zuvor das offengelegt, was es als … bezeichnete. erster dokumentierter Fall eines Cyberangriffs, der größtenteils von KI ausgeführt wurde–eine staatlich geförderte chinesische Gruppe, die KI-Agenten einsetzte, um autonom in etwa 30 globale Ziele, wobei die KI den Großteil der taktischen Operationen selbstständig durchführt.
Das Unternehmen hat zudem hochrangige US-Regierungsbeamte vertraulich über die vollen Funktionen von Mythos Preview informiert. Die Geheimdienste sind nun... aktiv Abwägung, wie das Modell sowohl offensive als auch defensive Hacking-Operationen umgestalten könnte.
💻 Das Open-Source-Problem
Eine Dimension des Projekts Glasswing, die über die prominente Koalition hinausgeht: Open-Source-SoftwareJim Zemlin, CEO der Linux Foundation, brachte es auf den Punkt: „In der Vergangenheit war Sicherheitsexpertise ein Luxus, der Organisationen mit großen Sicherheitsteams vorbehalten war. Open-Source-Entwickler, deren Software einen Großteil der kritischen Infrastruktur weltweit stützt, waren in der Vergangenheit weitgehend auf sich allein gestellt, was die Sicherheit betrifft.“
Anthropic hat gespendet 2,5 Millionen US-Dollar an Alpha-Omega und OpenSSF über die Linux Foundation und 1,5 Millionen US-Dollar an die Apache Software Foundation – wodurch die Betreiber kritischer Open-Source-Codebasen Zugang zu KI-gestützten Cybersicherheits-Schwachstellenscans in einem bisher unerreichbaren Umfang erhalten.
🔮 Was kommt als Nächstes?
Anthropic gibt an, dass das letztendliche Ziel die Bereitstellung von Mythos-Klasse-Modelle im MaßstabAllerdings erst, wenn neue Sicherheitsvorkehrungen getroffen wurden. Das Unternehmen plant, diese neuen Sicherheitsvorkehrungen mit einem bevorstehenden Update einzuführen. Claude Opus Modell Erstens ermöglicht es, sie mit einem Modell zu verfeinern, das nicht das gleiche Risikoniveau wie Mythos Preview birgt.
Das Wettbewerbsumfeld verändert sich bereits. Als OpenAI veröffentlichte GPT-5.3-Codex Im Februar bezeichnete das Unternehmen es als das erste Modell, das es im Rahmen seines Preparedness Frameworks als hochleistungsfähig für Cybersicherheitsaufgaben eingestuft hatte. Anthropics Schritt mit Glasswing signalisiert, dass die führenden Labore sehen Kontrollierte Bereitstellung – keine offene Freigabe–als der sich abzeichnende Standard für Modelle dieser Leistungsklasse.
Ob dieser Standard auch bei weiterer Verbreitung dieser Fähigkeiten Bestand haben wird, ist zum jetzigen Zeitpunkt eine offene Frage, die keine einzelne Initiative beantworten kann.


Einloggen









