Anthropic investiga un acceso no autorizado a su inteligencia artificial capaz de realizar ciberataques masivos
La startup de inteligencia artificial Anthropic ha confirmado este miércoles que investiga un posible acceso no autorizado a Claude Mythos Preview. Se trata de un modelo desarrollado recientemente capaz de encontrar agujeros de seguridad en sistemas informáticos que hasta ahora se consideraban robustos y que ha puesto en alerta a las grandes tecnológicas y principales bancos del mundo.
Su lanzamiento se había restringido a un puñado de empresas de confianza debido a estos riesgos, con el objetivo de que pudieran analizar su ciberseguridad e impedir que Claude Mythos desencadenara una campaña de ataques informáticos a gran escala. No obstante, este miércoles Bloomberg ha informado de que un grupo de personas ajeno a esa pantalla de seguridad ha accedido al modelo sin autorización. Horas más tarde, Anthropic ha reconocido que lo está investigando.
“Estamos investigando un informe que advierte de a un acceso no autorizado a Claude Mythos Preview a través de uno de nuestros entornos de proveedores externos”, ha declarado la startup. Este acceso se habría producido gracias al sistema utilizado por terceras compañías que realizan trabajos de desarrollo para Anthropic.
Según ha explicado Bloomberg, un pequeño grupo de personas en un foro privado obtuvo acceso al modelo el mismo día en que la startup anunció su despliegue para pruebas con socios estratégicos. No obstante, la empresa ha asegurado que no existen pruebas de que la actividad se extendiera más allá del entorno de ese proveedor.
Anthropic lanzó Mythos este mes bajo un despliegue restringido para que corporaciones como Amazon, Microsoft, Apple, Cisco y CrowdStrike pudieran identificar y parchear vulnerabilidades críticas en sus propios sistemas antes de que la tecnología llegue al público general. Algunos bancos estadounidenses también han tenido acceso al modelo.
Mozilla, la organización que desarrolla el navegador Firefox y que también ha contaco con ese acceso anticipado, ha publicado un parche para 271 vulnerabilidades detectadas por Mythos. “Nuestra experiencia es esperanzadora para los equipos que superan el vértigo y se ponen manos a la obra”, había declarado la organización. “Las vulnerabilidades informáticas son finitas, y estamos entrando en un mundo donde finalmente podremos encontrarlas todas”.
La aparición de Mythos también parecía haber relajado las tensiones entre la Casa Blanca y Anthropic. La startup fue incluida en una lista negra el pasado febrero por negarse a ceder ante algunas peticiones del Pentágono en cuanto al uso de su IA en la guerra de Irán. Esto provocó la ira de Donald Trump, que los denomino “locos izquierdistas”. Sin embargo, en los últimos días se han producido acercamientos y el presidente estadounidense ha afirmado que la tecnología de Anthropic “podría ser muy útil” y que sus dirigentes “se están encarrilando”.
La posible brecha de seguridad en Mythos se suma, no obstante, a otros incidentes recientes que han puesto bajo escrutinio los procesos de Anthropic. El pasado marzo, la compañía atribuyó a un error humano el descubrimiento del nombre y las descripciones de Mythos en un registro de datos accesible públicamente. Además, este mismo mes se produjo la publicación no autorizada del código fuente de Claude Code, su asistente de programación.