Actualités en vedette

Un modèle d'IA anthropique reste privé après la découverte de milliers de failles de sécurité

11 avril 2026 par l'AICC
Cybersécurité de l'IA

Le modèle d'IA le plus performant d'Anthropic a déjà été découvert des milliers de vulnérabilités en matière de cybersécurité liées à l'IA Sur tous les principaux systèmes d'exploitation et navigateurs web. L'entreprise a choisi de ne pas le publier, mais de le remettre discrètement aux organismes chargés du fonctionnement d'Internet.

Ce modèle est Aperçu du mythe de Claude, et l'initiative s'appelle Projet Glasswing.

Les partenaires de lancement comprennent Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, la Linux Foundation, Microsoft, Nvidia et Palo Alto Networks.

Au-delà de ce groupe central, Anthropic a étendu son accès à plus de 40 organisations supplémentaires qui conçoivent ou maintiennent des infrastructures logicielles critiques. Anthropic s'engage à verser jusqu'à 100 millions de dollars américains en crédits d'utilisation pour Mythos Preview dans le cadre de cet effort, ainsi que 4 millions de dollars de dons directs aux organisations de sécurité open source.

🔍 Un modèle qui a dépassé ses propres critères de référence

Mythos Preview n'a pas été spécifiquement conçu pour la cybersécurité. Anthropic a indiqué que ces capacités « ont émergé comme une conséquence directe des améliorations générales apportées au code, au raisonnement et à l'autonomie », et que les mêmes améliorations qui rendent le modèle plus performant pour corriger les vulnérabilités le rendent également plus performant pour les exploiter.

Ce dernier point est important. L'aperçu de Mythos comprend amélioré dans la mesure où elle sature en grande partie les référentiels de sécurité existants, obligeant Anthropic à recentrer son attention sur de nouvelles tâches concrètes – en particulier, vulnérabilités zero-dayCes défauts étaient jusqu'alors inconnus des développeurs du logiciel.

Parmi les conclusions : Bug vieux de 27 ans dans OpenBSD, un système d'exploitation reconnu pour sa sécurité renforcée. Dans un autre cas, le modèle a identifié et exploité de manière totalement autonome une Vulnérabilité d'exécution de code à distance vieille de 17 ans dans FreeBSDCVE-2026-4747Cette faille permet à un utilisateur non authentifié, où qu'il soit sur Internet, de prendre le contrôle total d'un serveur utilisant NFS. Aucune intervention humaine n'a été nécessaire pour la découverte ni l'exploitation de cette vulnérabilité après la première tentative de la localiser.

Nicholas Carlini, membre de l'équipe de recherche d'Anthropic, a décrit la capacité du modèle à enchaîner les vulnérabilités : « Ce modèle permet d'exploiter trois, quatre, voire cinq vulnérabilités qui, combinées, aboutissent à un résultat final très sophistiqué. J'ai découvert plus de bugs ces deux dernières semaines que durant tout le reste de ma vie. »

🚫 Pourquoi n'est-il pas publié ?

« Nous ne prévoyons pas de rendre Claude Mythos Preview accessible au grand public en raison de ses capacités en matière de cybersécurité. » Newton Cheng, responsable de la cybersécurité de l'équipe rouge Frontier chez Anthropic, a déclaré :

« Compte tenu du rythme des progrès de l'IA, il ne faudra pas longtemps avant que de telles capacités ne prolifèrent, potentiellement au-delà des acteurs qui s'engagent à les déployer en toute sécurité. Les répercussions – sur les économies, la sécurité publique et la sécurité nationale – pourraient être graves. »

Il ne s'agit pas d'une hypothèse. Anthropic avait déjà révélé ce qu'elle décrivait comme le Premier cas documenté de cyberattaque largement exécutée par une IA– un groupe parrainé par l'État chinois qui a utilisé des agents d'IA pour infiltrer de manière autonome environ 30 cibles mondiales, l'IA gérant la majorité des opérations tactiques de manière indépendante.

L'entreprise a également présenté en privé à de hauts responsables du gouvernement américain les capacités complètes de Mythos Preview. La communauté du renseignement est désormais… activement évaluer comment ce modèle pourrait remodeler les opérations de piratage offensives et défensives.

💻 Le problème de l'open source

Une dimension du projet Glasswing qui va au-delà de la coalition principale : logiciel libreJim Zemlin, PDG de la Linux Foundation, l'a exprimé clairement : « Par le passé, l'expertise en sécurité était un luxe réservé aux organisations dotées d'importantes équipes de sécurité. Les mainteneurs de logiciels libres, dont les logiciels sous-tendent une grande partie des infrastructures critiques mondiales, ont historiquement dû se débrouiller seuls en matière de sécurité. »

L'anthropique a don 2,5 millions de dollars américains à Alpha-Omega et OpenSSF par l'intermédiaire de la Linux Foundation, et 1,5 million de dollars américains à l'Apache Software Foundation – donnant aux responsables de bases de code open source critiques un accès à l'analyse des vulnérabilités de cybersécurité de l'IA à une échelle qui était auparavant hors de portée.

🔮 Et ensuite ?

Anthropic affirme que son objectif final est de déployer Maquettes de classe Mythos à l'échellemais seulement lorsque de nouvelles mesures de protection seront en place. L'entreprise prévoit de lancer de nouvelles mesures de protection lors d'une prochaine réunion. Modèle Claude Opus tout d'abord, en lui permettant de les affiner grâce à un modèle qui ne présente pas le même niveau de risque que Mythos Preview.

Le paysage concurrentiel est déjà en train de changer. Lorsque OpenAI a publié Codex GPT-5.3 En février, l'entreprise a déclaré qu'il s'agissait du premier modèle qu'elle classait comme hautement performant pour les tâches de cybersécurité dans le cadre de son dispositif de préparation. L'accord d'Anthropic avec Glasswing indique que les laboratoires de pointe voient Déploiement contrôlé – pas de diffusion publique–comme norme émergente pour les modèles de ce niveau de capacité.

La question de savoir si cette norme se maintiendra à mesure que ces capacités se généraliseront reste, à ce stade, une question ouverte à laquelle aucune initiative isolée ne peut répondre.

Plus de 300 modèles d'IA pour
OpenClaw et agents IA

Économisez 20 % sur vos coûts