IA

Claude Fable 5 regresa a todo el mundo: Anthropic bloqueó el ataque, no debilitó el modelo

Adrian Kessler

Claude Fable 5, el modelo de inteligencia artificial más potente de Anthropic, volvió a estar disponible en todo el mundo. El regreso llegó después de dieciocho días de suspensión total, que comenzó cuando el gobierno de Estados Unidos impuso controles de exportación que requerían que Anthropic verificara la nacionalidad de sus usuarios en tiempo real. La empresa determinó que no podía cumplir ese requisito a escala y suspendió el acceso por completo.

Lo que activó esos controles fue una técnica de jailbreak descubierta por investigadores de Amazon. El método usaba Fable 5 para identificar vulnerabilidades de software de formas que los controles de exportación prohíben para ciertos ciudadanos extranjeros. La investigación interna encontró algo que complica la lógica de la regulación: los mismos tipos de vulnerabilidades podían identificarse con modelos mucho menos potentes, como Opus 4.8, GPT-5.5 y Kimi K2.7. La capacidad no era exclusiva de Fable 5.

Lo que cambió para que volviera

Lo nuevo es un clasificador de seguridad entrenado para bloquear la técnica exacta que documentaron los investigadores de Amazon. Anthropic dice que captura el método en más del 99 por ciento de los casos. No es una solución total contra futuros jailbreaks: es una corrección específica para una vulnerabilidad conocida. El clasificador actúa antes de que el modelo procese cada solicitud, redirigiendo las que coinciden con los patrones documentados.

Lo que eso implica para la regulación de la inteligencia artificial es más amplio. Los controles de exportación se aplicaron a Fable 5 no porque el modelo fuera el único capaz de provocar el daño, sino porque una técnica conocida lo explotó. Se levantaron no porque el marco regulatorio resolviera ese problema, sino porque un clasificador cerró la brecha documentada. Anthropic trabaja con Amazon, Microsoft y Google en un marco compartido para medir la gravedad de los jailbreaks, pero ese estándar todavía no existe.

Qué hace el modelo y cuánto cuesta

El modelo no cambió. Fable 5 está diseñado para razonamiento de largo alcance y trabajo agéntico: tareas que requieren planificación y corrección de rumbo en secuencias largas sin intervención humana en cada paso. Tiene una ventana de contexto de un millón de tokens, que también es el valor por defecto. La producción máxima por respuesta es de 128.000 tokens. El razonamiento está siempre activo y se devuelve como resumen legible.

El acceso tiene condiciones nuevas. Fable 5 requiere 30 días de retención de datos, lo que lo excluye de los acuerdos de retención cero, habituales en sectores como salud, derecho y gobierno. El precio es de diez dólares por millón de tokens de entrada y cincuenta por millón de tokens de salida. Si una solicitud activa los clasificadores de seguridad, el sistema puede derivarla a un modelo alternativo en vez de rechazarla, y si ese cambio es visible o no para el usuario depende de cómo configure su servicio cada operador.

Disponibilidad

Fable 5 tiene un modelo hermano, Claude Mythos 5, con las mismas capacidades base y el mismo precio, pero con funciones ofensivas de ciberseguridad que Fable 5 no tiene. Mythos 5 está disponible a través de Project Glasswing. El acceso a Mythos 5 se restableció para ciertas organizaciones de Estados Unidos una semana antes que el regreso global de Fable 5.

Fable 5 está disponible ahora en la plataforma Claude, Claude.ai, Claude Code y Claude Cowork. En los planes Pro, Max, Team y algunos Enterprise está incluido hasta el 50 por ciento de los límites de uso semanales hasta el 7 de julio, fecha en que pasa a precios por créditos. El acceso a través de AWS, Google Cloud y Microsoft Foundry se restaura de manera gradual. El marco que va a definir cómo responder la próxima vez que aparezca una nueva técnica de evasión está todavía en construcción.

Etiquetas: , , , , ,

Discussion

There are 0 comments.