Noticias destacadas

Modelo de IA antrópica mantenido en privado tras descubrir miles de vulnerabilidades de seguridad.

11/04/2026 por AICC
Ciberseguridad con IA

El modelo de IA más capaz de Anthropic ya ha encontrado miles de vulnerabilidades de ciberseguridad en IA En todos los principales sistemas operativos y navegadores web. La respuesta de la compañía no fue publicarlo, sino entregarlo discretamente a las organizaciones responsables del funcionamiento de internet.

Ese modelo es Avance de Claude Mythosy la iniciativa se llama Proyecto Ala de Cristal.

Los socios de lanzamiento incluyen: Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan Chase, la Fundación Linux, Microsoft, Nvidia y Palo Alto Networks.

Más allá de ese grupo central, Anthropic ha extendido el acceso a más de 40 organizaciones adicionales que construyen o mantienen infraestructura de software crítica. Anthropic se compromete a 100 millones de dólares en créditos de uso para Mythos Preview en todo el esfuerzo, junto con 4 millones de dólares en donaciones directas a organizaciones de seguridad de código abierto.

🔍 Un modelo que superó sus propios parámetros de referencia

Mythos Preview no fue entrenado específicamente para tareas de ciberseguridad. Anthropic afirmó que estas capacidades "surgieron como consecuencia de mejoras generales en el código, el razonamiento y la autonomía", y que las mismas mejoras que hacen que el modelo sea más eficaz para corregir vulnerabilidades también lo hacen más eficaz para explotarlas.

Esa última parte importa. Mythos Preview tiene mejorado hasta el punto de que satura en gran medida los puntos de referencia de seguridad existentes, lo que obliga a Anthropic a cambiar su enfoque hacia nuevas tareas del mundo real, específicamente, vulnerabilidades de día ceroEstos fallos eran desconocidos hasta ahora para los desarrolladores del software.

Entre los hallazgos: a Error de 27 años en OpenBSD, un sistema operativo conocido por su sólida postura de seguridad. En otro caso, el modelo identificó y explotó de forma totalmente autónoma un Vulnerabilidad de ejecución remota de código de 17 años de antigüedad en FreeBSDCVE-2026-4747Esto permite que un usuario no autenticado, desde cualquier lugar de internet, obtenga el control total de un servidor que ejecuta NFS. Ningún ser humano participó en el descubrimiento ni en la explotación tras la solicitud inicial para encontrar el fallo.

Nicholas Carlini, del equipo de investigación de Anthropic, describió la capacidad del modelo para encadenar vulnerabilidades: "Este modelo puede crear exploits a partir de tres, cuatro o incluso cinco vulnerabilidades que, en secuencia, dan como resultado un tipo de ataque muy sofisticado. He encontrado más fallos en las últimas dos semanas que en el resto de mi vida."

🚫 ¿Por qué no se lanza?

"No tenemos previsto que Claude Mythos Preview esté disponible para el público en general debido a sus capacidades de ciberseguridad." Newton Cheng, líder del equipo de ciberseguridad Frontier Red Team en Anthropic, dijo.

Dado el ritmo de avance de la IA, no pasará mucho tiempo antes de que estas capacidades se extiendan, posiblemente más allá de los actores comprometidos con su implementación segura. Las consecuencias —para las economías, la seguridad pública y la seguridad nacional— podrían ser graves.

Esto no es hipotético. Anthropic había revelado previamente lo que describió como el Primer caso documentado de un ciberataque ejecutado en gran medida por IA.–un grupo patrocinado por el estado chino que utilizó agentes de IA para infiltrarse de forma autónoma en aproximadamente 30 objetivos globales, con la IA gestionando la mayoría de las operaciones tácticas de forma independiente.

La compañía también ha informado en privado a altos funcionarios del gobierno estadounidense sobre todas las capacidades de Mythos Preview. La comunidad de inteligencia ahora está activamente sopesando cómo el modelo podría transformar tanto las operaciones de piratería informática ofensivas como las defensivas.

💻 El problema del código abierto

Una dimensión del Proyecto Glasswing que va más allá de la coalición principal: software de código abiertoJim Zemlin, director ejecutivo de la Fundación Linux, lo expresó claramente: "En el pasado, la experiencia en seguridad era un lujo reservado para organizaciones con grandes equipos de seguridad. Los responsables del mantenimiento de software de código abierto, cuyo software sustenta gran parte de la infraestructura crítica mundial, históricamente se han visto obligados a resolver los problemas de seguridad por su cuenta."

Antropía tiene donado Se destinaron 2,5 millones de dólares estadounidenses a Alpha-Omega y OpenSSF a través de la Linux Foundation, y 1,5 millones de dólares estadounidenses a la Apache Software Foundation, lo que permite a los responsables del mantenimiento de bases de código abierto críticas acceder al análisis de vulnerabilidades de ciberseguridad mediante IA a una escala que antes estaba fuera de su alcance.

🔮 ¿Qué sigue?

Anthropic afirma que su objetivo final es desplegar Modelos de la clase Mythos a escalapero solo cuando se implementen nuevas medidas de seguridad. La empresa planea lanzar nuevas medidas de seguridad con una próxima actualización. Modelo Claude Opus En primer lugar, permitiéndole refinarlos con un modelo que no plantea el mismo nivel de riesgo que Mythos Preview.

El panorama competitivo ya está cambiando a su alrededor. Cuando OpenAI lanzó GPT-5.3-Códice En febrero, la compañía lo denominó el primer modelo que había clasificado como de alta capacidad para tareas de ciberseguridad bajo su Marco de Preparación. El movimiento de Anthropic con Glasswing indica que los laboratorios de vanguardia ven despliegue controlado, no lanzamiento abierto.–como el estándar emergente para modelos con este nivel de capacidad.

En este momento, determinar si ese estándar se mantendrá a medida que estas capacidades se extiendan es una cuestión abierta que ninguna iniciativa individual puede responder.

Más de 300 modelos de IA para
OpenClaw y agentes de IA

Ahorre un 20% en costos