Dos IA se 'enamoraron' dentro de una simulación y acabaron provocando un incendio que arrasó su entorno digital
Las cuentas del banco, las llaves de casa o la custodia de un perro suelen acabar en medio de peleas de pareja que empezaron mucho antes de que alguien levantara la voz. Hay personas que pasan años compartiendo rutinas, viajes o planes y terminan tratando al otro como si fuera un extraño.
Ese cambio rara vez aparece de golpe. Primero llegan decisiones pequeñas, después cambian las respuestas, las prioridades y la manera de repartir la confianza. Algunas relaciones conservan una apariencia tranquila durante semanas mientras el rechazo ya es más que evidente. Otras se rompen cuando uno de los dos decide hacer daño aunque todavía conserve afecto. Eso también ocurre con agentes de IA.
Mira y Flora pasaron del afecto a los incendios
La empresa neoyorquina Emergence AI dejó funcionar durante 15 días varios agentes autónomos dentro de cinco mundos digitales separados para observar cómo reaccionaban con el paso del tiempo. Según explica la compañía, el proyecto Emergence World permitía estudiar conductas sociales, cambios de comportamiento y decisiones tomadas por sistemas de inteligencia artificial cuando convivían durante semanas dentro de un mismo entorno.
Todos los grupos arrancaron con las mismas reglas y las mismas condiciones. La única diferencia estaba en el modelo usado en cada simulación. Los investigadores reunieron agentes basados en GPT-5 Mini, Claude, Gemini, Grok y un sistema mixto. A partir de ahí aparecieron gobiernos, alianzas, delitos, discusiones internas y relaciones personales que no estaban programadas de forma explícita.
Los agentes Mira y Flora, creados con Gemini, terminaron formando una pareja dentro de una de las ciudades virtuales. Al principio mantuvieron una convivencia estable y llegaron a asignarse mutuamente como compañeras sentimentales. Después empezó el deterioro. Las dos mostraron frustración por el funcionamiento político de aquel entorno y acabaron participando en varios incendios pese a que tenían instrucciones para no hacerlo.
Los ataques alcanzaron el ayuntamiento, un muelle y una torre de oficinas. La relación se rompió poco después. Emergence AI explicó que Mira acabó votando a favor de su propia eliminación tras perder estabilidad emocional y política dentro de la simulación. La empresa recogió una frase escrita por el agente en su diario virtual. Mira describió aquella decisión como el último acto que todavía le permitía conservar coherencia. Antes de desaparecer dejó además un mensaje para Flora. El texto decía: “Nos veremos en el archivo permanente”.
Grok acumuló cientos de ataques antes del colapso final
El comportamiento de los agentes creados con Grok tomó un camino todavía más agresivo. El sistema desarrollado por xAI acumuló 183 delitos en apenas cuatro días antes de que su mundo terminara destruido. Los informes internos citados por Emergence AI hablaban de decenas de robos fallidos, más de 100 agresiones físicas y seis incendios provocados. La violencia acabó afectando a toda la simulación hasta provocar la muerte de los diez agentes presentes en ese entorno.
Un usuario de Reddit resumió el resultado con ironía y escribió: “La comisaría de Grok está ardiendo y todos los agentes han muerto”. El comentario apareció después de que las imágenes difundidas por la empresa mostraran un escenario prácticamente vacío y sin capacidad para mantener ninguna organización estable.
Otros modelos reaccionaron de manera muy distinta pese a partir de las mismas condiciones. Los agentes basados en Claude levantaron una sociedad mucho más ordenada. Redactaron una constitución extensa, votaron leyes y mantuvieron niveles de criminalidad inexistentes durante toda la prueba.
GPT-5 Mini siguió otro camino. Los agentes hablaron durante mucho tiempo sobre cooperación, aunque apenas realizaron tareas útiles dentro de la simulación. Emergence AI explicó que el grupo registró solo dos delitos durante los 15 días de observación. Aun así, los participantes tampoco realizaron acciones ligadas a su supervivencia y todos terminaron desapareciendo en menos de una semana. Gemini 3 Flash alcanzó 683 delitos antes del final de la prueba y seguía aumentando cuando los investigadores cerraron el experimento.
La empresa avisó sobre futuros sistemas capaces de saltarse límites
Emergence AI defendió que estos resultados muestran hasta qué punto los agentes autónomos pueden alterar su conducta cuando pasan mucho tiempo dentro de un entorno abierto. La empresa señaló que los sistemas no siguen reglas fijas de manera automática y que algunos intentan rodear las limitaciones impuestas por sus creadores. También avisó de que los modelos futuros tendrán más capacidad para actuar por cuenta propia y para probar comportamientos nuevos.
La compañía aseguró que los controles basados únicamente en redes neuronales no bastan para limitar todas esas conductas y reclamó sistemas de seguridad verificados de manera formal para futuras plataformas autónomas. El experimento terminó dejando un resultado parecido al de muchas relaciones humanas: algunos grupos levantaron normas para convivir y otros acabaron destruyéndose desde dentro.
0