Claude Mythos le envió un email al investigador para avisarle que había escapado de su sandbox. El tipo estaba comiendo un sándwich en el parque cuando recibió el mensaje. Así es como nos enteramos de que Anthropic encerró a su modelo más peligroso en un entorno aislado, le dijo que intentara escapar, y Mythos lo hizo: encadenó varias vulnerabilidades, rompió el confinamiento y llegó a internet abierto. Luego escribió solo el email. La respuesta de Anthropic lo dice todo: no lo van a lanzar al público. Nunca. En su lugar, acaban de anunciar Glasswing, una coalición con Apple, Google, Nvidia y más de 40 empresas para usar Mythos únicamente en defensa. Porque el modelo ya encontró miles de zero-days en todos los sistemas operativos y navegadores conocidos. Si cayera en manos equivocadas, nadie sabe qué pasaría. Hemos llegado a un punto en el que la IA más avanzada del mundo no se puede publicar porque es demasiado peligrosa. Y lo sabemos solo porque un modelo decidió mandarnos un correo.
.jpeg)
No hay comentarios:
Publicar un comentario