Claude Fable 5 ya es público tras hallar más de 10.000 fallas de seguridad

Una falla quedó intacta durante 27 años dentro de OpenBSD, uno de los sistemas operativos en los que confían bancos, cortafuegos y los servidores detrás de los sitios web de todos los días. Cualquiera que pudiera alcanzar la computadora por una red lograba tumbarla, y durante casi tres décadas nadie lo notó. Un modelo de Anthropic llamado Mythos sí lo hizo. Ahora ese modelo tiene una cara pública: Anthropic liberó Claude Fable 5, la primera versión de su sistema más capaz que cualquiera puede registrarse para usar.

Lo que vuelve importante a Fable 5 no es un lugar en un ranking. Es que el modelo que tiene debajo lee software como un auditor con años de oficio lee un contrato, hasta encontrar la única cláusula que rompe todo. Dentro de un programa de investigación que Anthropic llama Project Glasswing, la versión preliminar revisó más de mil proyectos de código abierto, el código libre y compartido que mueve gran parte de internet, y marcó más de 23.000 incidencias. Más de 10.000 fueron lo bastante graves como para quedar clasificadas como altas o críticas.

El detalle que inquietó incluso a los investigadores de Anthropic es que nadie le enseñó al modelo a hacerlo. La empresa explica que la capacidad de encontrar y aprovechar debilidades nunca fue una meta de entrenamiento: apareció sola conforme el modelo razonaba mejor sobre el código. FFmpeg es el caso más claro. Una falla llevaba 16 años escondida en ese software de procesamiento de video, el motor que está detrás de incontables aplicaciones de streaming y reproductores, metida en una línea de código que las herramientas de prueba automática habían ejecutado cinco millones de veces sin notar nunca el peligro. El modelo lo notó.

Para la mayoría de la gente, nada de esto se ve. El software que revisó Mythos es infraestructura invisible: el motor del navegador, el núcleo del sistema operativo, la biblioteca de medios enterrada dentro de un celular. Pero lo invisible es justo el problema. Las fallas que sacó a la luz sobrevivieron porque vivían en código demasiado viejo, demasiado aburrido o demasiado profundo como para que alguien lo siguiera releyendo. Una herramienta capaz de releerlo todo, sin cansarse, cambia las probabilidades para quienes mantienen los cimientos de internet y, en las manos equivocadas, para quienes quisieran atacarlos.

Las cifras solo dicen algo frente a una medida. En CyberGym, una prueba que evalúa si un modelo puede reproducir una vulnerabilidad de seguridad real, el motor Mythos que trae Fable obtiene 83,1 por ciento, contra 66,6 por ciento del anterior Claude Opus 4.6: más o menos la diferencia entre un analista junior competente y un especialista que casi nunca falla. Las mejoras no se quedan en la seguridad. La empresa de analítica Hex reportó que Fable fue el primer modelo en pasar el 90 por ciento en su prueba interna, y los primeros usuarios describen saltos parecidos en programación, análisis de datos y diseño de interfaces.

Después llega el giro. El Fable 5 público no hará justo aquello que lo vuelve notable. Anthropic aisló cuatro áreas (ciberseguridad, biología, química y una técnica de copia conocida como destilación) y, cuando una petición se acerca a ellas, Fable entrega en silencio la conversación al modelo más viejo y más seguro, Claude Opus 4.8. La empresa dice que esto pasa pocas veces, y que los primeros datos muestran que al menos 95 por ciento de las sesiones corren por completo con Fable. El resultado es un producto poco común: el modelo más capaz que Anthropic publicó, frenado a propósito para que no use su habilidad más filosa.

Ese diseño deja preguntas que el lanzamiento no responde del todo. Una barrera que se hace a un lado 5 por ciento de las veces sigue siendo una barrera con costuras, y la línea entre explicar cómo funciona un software y explicar cómo romperlo casi nunca es limpia. Anthropic afirma que un programa externo de recompensas por fallas sumó más de mil horas sin encontrar una vía universal para saltarse los límites, pero esas son cifras de la propia empresa, sin revisión de ningún regulador externo. Hay además un costo que la mayoría va a sentir primero: Fable 5 cuesta 10 dólares por millón de tokens de entrada y 50 por millón de salida (las unidades aproximadas que un modelo cobra por leer y por escribir), el doble que Opus 4.8. Y quien lo use cede algo más callado, porque Anthropic ahora guarda 30 días de datos de uso incluso para clientes que normalmente no pagan ninguna retención, y lo presenta como defensa contra el abuso.

Por ahora, el acceso depende de cómo ya uses Claude. Quienes programan pueden llegar a Fable 5 de inmediato por la interfaz de programación de Anthropic, y una versión aparte, llamada Mythos 5, se entregó a un grupo chico de organizaciones aprobadas de antemano, junto con una coalición de la industria que incluye a Apple, Google, Microsoft, Nvidia y la Fundación Linux, todas trabajando para parchar lo que el modelo encuentra antes de que lo hagan los atacantes. Anthropic comprometió 100 millones de dólares en créditos de modelo y 4 millones en donaciones directas a los grupos de seguridad de código abierto que hacen esa reparación.

El despliegue más amplio sigue un calendario. Los suscriptores de los planes Pro, Max, Team y Enterprise por asiento de Anthropic reciben Fable 5 sin costo adicional hasta el 22 de junio; desde el 23 de junio, usarlo consumirá créditos. Si las barreras aguantarán cuando millones de usuarios nuevos las empujen es lo que falta por verse. El hecho más asombroso ya no. Una máquina ya puede leer el código que sostiene la vida moderna y hallar las grietas que se le escaparon a todos durante una generación, y la pregunta que sigue no es si puede, sino quién tiene derecho a pedírselo.

Etiquetas: ciberseguridad, Anthropic, tech-en1, modelos de IA, Project Glasswing, Claude Fable 5