Claude Mythos, la IA más peligrosa del mundo, podría integrarse en herramientas para todos

Los usuarios han detectado la opción de activar el modelo ‘claude-mythos-1-preview’ en Claude Code. Anthropic admite que nadie está preparado para defenderse de sus capacidades de ciberataque autónomo.

Alguien en Anthropic ha abierto una caja que igual no debería haberse abierto. Se llama Claude Mythos y, según los primeros indicios, es capaz de hackear sistemas sin que tú muevas un dedo. Y ahora, ese modelo podría colarse en herramientas que usamos todos los días.

Qué es exactamente Claude Mythos y por qué da tanto miedo

Anthropic presentó este modelo en versión previa hace semanas y lo dejó claro: no es una IA más. Mythos es un salto cualitativo en autonomía y razonamiento, muy por encima de Opus 4.7. Lo que puso a temblar a media industria no fue tanto su inteligencia, sino su capacidad para desarrollar ciberataques funcionales de forma autónoma. La propia empresa reconoció que su lanzamiento sin control suponía un riesgo para la infraestructura digital global y frenó el despliegue mientras desarrollaba salvaguardas más robustas.

Pero el freno parece tocando a su fin. Varios usuarios han detectado la opción ‘claude-mythos-1-preview’ en la versión pública de Claude Code, el entorno de programación de la compañía. El mismo identificador apareció temporalmente en Claude Security. La integración en herramientas de uso cotidiano apunta a que el despliegue masivo está al caer.

Publicidad

El dilema: curar vulnerabilidades o abrir la puerta al apocalipsis cibernético

Mientras tanto, Anthropic lleva usando Mythos de forma controlada a través de Glasswing, un proyecto para encontrar agujeros en software crítico antes de que los malos puedan explotarlos. Los resultados son para frotarse los ojos (y no precisamente de alegría): en su primer mes, el modelo identificó 10.000 vulnerabilidades de nivel alto o crítico. Cloudflare encontró 2.000 errores en sus sistemas de ruta crítica y Mozilla localizó 271 fallos en Firefox 150 durante las pruebas con la preview.

Una IA detectando miles de agujeros al mes mientras los parches avanzan a paso de tortuga. Eso no es una red de seguridad, es una fábrica de riesgos.

La paradoja es brutal: “Los modelos de clase Mythos permitirán crear software mucho más seguro al detectar errores antes de la implementación”, dice Anthropic. Pero inmediatamente matizan que “este período transitorio, mientras se descubren rápidamente las vulnerabilidades y se corrigen lentamente, presenta nuevos riesgos”. Traducción: vamos a darte una herramienta que te avisa de que tu casa está llena de agujeros, pero si alguien te la roba, podrá entrar por todos ellos sin despeinarse.

Anthropic también ha lanzado Claude Security, que ya ha parcheado más de 2.100 vulnerabilidades. La cuestión es que nadie ha desarrollado mecanismos de defensa para un modelo de este calibre. La propia compañía advierte que si se libera sin salvaguardas, pronto será barato y fácil para casi cualquiera explotar software defectuoso. Miedo da pensarlo.

Se veía venir y nadie hizo nada (ni siquiera la UE)

Que la IA alcanzase capacidades de hacking autónomo era cuestión de tiempo, pero el anuncio de Mythos llega en un vacío regulador absoluto. Mientras los legisladores discuten sobre deepfakes, Anthropic se prepara para meter un hacker con superpoderes en las manos de cualquier desarrollador. El verdadero riesgo de de que todo esto se descontrole es que la barrera de entrada a la ciberdelincuencia profesional caiga a cero. Y no, no hay un protocolo anti-Mythos en ningún gobierno.

La promesa de una IA que parchea sistemas en tiempo real suena a utopía, pero el lado oscuro es que esos mismos dedos digitales pueden apretar el gatillo. ¿Estamos listos para convivir con un modelo que puede hacer ambas cosas con la misma soltura? La respuesta, por ahora, es un no rotundo.

Hype-O-Meter

Nivel de hype: 8,5/10. Anthropic juega a ser el bombero y el pirómano al mismo tiempo. La capacidad para encontrar 10.000 vulnerabilidades en un mes es alucinante (y aterradora). Si las salvaguardas funcionan, podría cambiar la ciberseguridad; si no, prepárate para un nuevo tipo de ciberdelincuencia low cost.

El resumen para vagos (TL;DR)

  • 🎯 ¿Qué ha pasado? Anthropic podría integrar su modelo de IA capaz de hackear, Claude Mythos, en herramientas como Claude Code.
  • 🔥 ¿Por qué importa? En un mes encontró 10.000 vulnerabilidades críticas y la empresa admite que no hay defensas contra él.
  • 🤔 ¿Nos afecta o es solo un meme? Si se libera sin control, cualquiera con acceso a Claude Code podría lanzar ciberataques sofisticados. La cosa va muy en serio.