Anthropic lanzó Claude Fable 5, el primer maniquí de la clase Mythos adecuado para el conocido en caudillo, el 9 de junio de 2026. La compañía dice que el maniquí supera las capacidades de los modelos publicados anteriormente y proporciona un rendimiento de vanguardia en ingeniería de software, investigación científica y tareas de conocimiento complejas.
Sin requisa, la empresa lo lanzó porque Equipado con un mecanismo para sitiar consultas de ciberseguridad.Biología, Química, Destilación de modelos, redirija esas respuestas a Claude Opus 4.8.
El motivo del asedio es una remisión directa a lo que Anthropic ha documentado en las semanas previas al extensión. A través del Plan Glasswing, un software restringido donde Anthropic ha estado distribuyendo Mythos Preview desde abril, la compañía y sus aproximadamente 50 socios descubrieron: 10.000 o más vulnerabilidades críticas o de suscripción gravitación Esto es lo que Anthropic describe como el software más crítico para el sistema en todo el mundo.
Los participantes de la evaluación incluyen Cloudflare, Mozilla, Microsoft, Oracle y Palo Stop Networks, así como bancos e instituciones de infraestructura crítica.
Cloudflare identificó 2000 errores en su sistema de ruta crítica, 400 de los cuales fueron críticos o de suscripción gravitación.Tasa de falsos positivos considerada mejor por los equipos corporativos que los auditores humanos. Mozilla descubrió y solucionó 271 vulnerabilidades en Firefox 150. Esto es más de 10 veces el número de vulnerabilidades detectadas en Firefox 148 con Claude Opus 4.6.
El Instituto de Seguridad de la IA del Reino Unido señaló que Mythos Preview es el primer maniquí que resuelve de forma autónoma dos simulaciones de ciberataques de un extremo a otro.
Ese mismo poder de ataque es lo que Anthropic decidió lindar en Fable 5. Sin salvaguardias, la funcionalidad del maniquí en áreas como la ciberseguridad sería ineficaz. Puede ser mal utilizado Esto podría causar daños importantes, dijo la empresa en un comunicado.
La empresa advierte que Los filtros están ajustados de forma conservadora y pueden sitiar solicitudes inofensivas..
Mitos ilimitados: solo defensor
Fable 5 es diferente de Mythos 5, que es ilimitado. Mythos 5 tiene las mismas características que Fable 5, pero se han eliminado las protecciones en algunas áreas. Inicialmente se implementará a través del Plan Glasswing como una aggiornamento de Mythos Preview en colaboración con el gobierno de EE. UU.
Anthropic dice que tiene las características de ciberseguridad más avanzadas de todos los modelos del mundo. Sin requisa, en comparación con sus principales competidores, Anthropic mantiene la posición más restrictiva del mercado. Mientras OpenAI y Google DeepMind han relajado gradualmente algunos filtros para aumentar la utilidad de sus modelos, Anthropic sigue priorizando la seguridad, incluso a costa de lindar la funcionalidad.
Esta logística “constitucional” ha sido elogiada por los reguladores y criticada por los promotores que buscan una viejo flexibilidad.
Fable 5 se lanzó al conocido en respuesta a la subida documentada de ataques asistidos por IA contra la infraestructura de criptomonedas. Según Maximiliano Carjuzaa, cofundador de Money On Chain, casi el 100% de los ataques DeFi registrados en los últimos meses fueron IA involucrada hasta cierto punto. El CTO de Ledger, Charles Guillemet, advirtió en abril que la IA estaba reduciendo la barrera de entrada para los atacantes.
Ese mes, la industria registró al menos 34 ataques, lo que resultó en pérdidas de casi 635 millones de dólares. Esto representa casi el 80% del robo total para 2026.
Para el ecosistema de las criptomonedas, el extensión conocido de Fable 5 plantea ciertas tensiones. Los mismos filtros que Anthropic considera suficientes para uso caudillo no han sido validados Actúa de forma independiente en presencia de intentos de distracción organizados.
Fable 5 bloquea las consultas de ciberseguridad, pero la traducción sin restricciones, Mythos 5, ya está en funcionamiento en manos de organizaciones gubernamentales y de infraestructura y tiene una capacidad sin precedentes para detectar vulnerabilidades críticas de forma autónoma, como lo demuestran los registros del Plan Glasswing.
(Traducción de etiquetas) Hacker



