En las últimas semanas han existido múltiples debates acerca de las imágenes generadas mediante inteligencia artificial (IA). Softwares como DALL-E 2, Midjourney y Stable Diffusion están en el epicentro de la crítica debido a la utilización que se les está dando. ¿Se puede otorgar un prestigioso premio de fotografía a una imagen realizada sin una cámara fotográfica? ¿Es ético que una oenegé utilice imágenes generadas por estos softwares para denunciar la violencia policial? ¿La IA puede entrenarse y utilizar sin permiso fotografías con copyright?, son las preguntas que los profesionales ponen sobre la mesa.

En el marco de PHotoEspaña 2023 (del 31 de mayo al 3 de septiembre), elDiario.es dialoga con el editor y docente Gonzalo Golpe (Madrid, 1975). La editorial La Fábrica publica el 5 de junio When the wind, uno de los primeros libros del mundo en los cuales se ha utilizado la IA como una herramienta para generar imágenes. En este trabajo pionero, el autor de la obra, Gonzalo Golpe, relata de manera visual una fábula distópica –creada con la asistencia de Martín Bollati y DALL-E 2 (IA desarrollada por la compañía Open AI, desarrolladora de ChatGPT y participada por Microsoft)– que invita a observar los miedos de nuestra sociedad y a cuestionarnos cómo usamos la tecnología. “La IA no es inteligente en términos humanos. La IA no es imaginante”, asegura Golpe.

El pasado 13 de abril, por primera vez en la historia, una imagen creada mediante IA ganó un reconocido premio fotográfico, el Sony World Photography Awards 2023 en la categoría “Creatividad”. No obstante, el artista alemán que la presentó, Boris Eldagsen, renunció al premio de 5.000 dólares porque, según afirmó en su discurso, “las imágenes IA y la fotografía no deberían competir en un premio como este. Son diferentes. La IA no es fotografía”. Eldagsen realizó este acto performativo con el fin de hacer ver que los concursos de este tipo no están preparados para el auge actual que está viviendo la IA. “No entender lo que supone llamar a estas imágenes sintéticas ‘fotografías’ es peligroso”, señala, por su parte, Gonzalo Golpe.

Qué es y qué no es real

Dos semanas más tarde, el 2 de mayo, la división noruega de Amnistía Internacional publicó un informe acerca de la violencia policial que se ejerció durante las protestas de 2021 en Colombia. A pesar de que el Paro Nacional del país se documentó gracias al fotoperiodismo, la organización en defensa de los derechos humanos acompañó esta campaña con varias imágenes generadas mediante IA.

La organización informó de ello en los pies de las imágenes. Sin embargo, la utilización de estas fue muy criticada en redes sociales, lo que provocó que Amnistía Internacional retirase las imágenes sintéticas. Según Amnistía, la decisión de no utilizar fotografías de fotoperiodistas en primera instancia fue tomada para proteger la identidad de las personas que sufrieron la brutalidad policial.

¿Qué sentido tiene que la IA llegue a un lugar donde el ser humano ya llegó? El noema de la fotografía –teorizado en La cámara lúcida (1980) de Roland Barthes– es: “Esto ha sido”. En el caso de estas no-fotografías, fabricadas mediante modelos de IA que crean imágenes a partir de texto, el “esto ha sido” barthiano carece de sentido alguno. “Las imágenes que generan son producto de un entrenamiento desprovisto de sentido crítico y moral. Estos programas son herederos y representantes de un sistema visual basado en el privilegio, en la discriminación, en la ocultación y el escarnio. Por eso toma lo humano como masculino, joven y blanco”, analiza Golpe.

Los softwares que generan este tipo de contenido se han entrenado y se nutren de fotografías disparadas por seres humanos que, en muchas ocasiones, tienen derechos de autor. Motivo por el cual Getty Images, una de las agencias de fotografía más populares, ha denunciado ante el Tribunal Supremo de Londres a Stability IA, empresa propietaria de la IA generativa de código abierto Stable Diffusion que, según Getty, está infringiendo la propiedad intelectual de millones de imágenes con copyright. Ilegalidad que individualmente también están sufriendo profesionales de la fotografía de todo el mundo.

Como destapó Newtral, en el marco español, al menos el trabajo de 55 fotógrafas y fotógrafos nutre ilícitamente a LAION, el dataset que entrenó a Stable Diffusion. “Creo que es necesario, urgente e incluso obligatorio establecer controles legislativos que obliguen a definir e identificar estas imágenes así como controlar su uso, sobre todo en ciertos ámbitos”, propone Golpe.

“Estos modelos han sido educados a partir de sesgos, responden a intereses segregacionistas que buscan aislar las diferencias para poder ejecutar sobre ellas políticas de control y represión. Son instrumentos. No solo del progreso humano, sino también de la degeneración y la pérdida de humanidad. Ya nacieron viciadas. Su actual desarrollo está siendo soportado por una mano de obra vulnerable que es explotada y además está desconectada de la agenda de objetivos que manejan las empresas titulares de sus patentes. Es alarmante”, avisa Gonzalo Golpe.

Esto no es un fotolibro

Citando a Susan Sontag, “la fotografía en un libro es, obviamente, la imagen de una imagen”. En el caso de When the wind (La Fábrica, 2023) –el primer libro publicado en España obra de un ser humano con la asistencia de una IA generadora de imágenes– no estamos ante un fotolibro. Esta narrativa visual, argumentada mediante los textos (prompts) que Gonzalo Golpe tecleó en DALL-E 2, es una obra de autor. Una fábula de ciencia ficción postapocalíptica que encierra un mensaje ecologista. En When the wind se experimenta un discurso visual sinestésico en un contexto de tristeza. Un extraordinario trabajo semiótico (y siniestro) con un halo melancólico en los tonos flúor que caracterizan a este tipo de modelos.

“Me sirvo de esta tecnología para ejecutar una composición visual [...] Mientras creaba, editaba y secuenciaba las imágenes lo que estaba haciendo era proyectar mi ánimo en una suerte de sinfonía visual, como si tararease las imágenes”, cuenta Golpe.

Gonzalo Golpe no es fotógrafo. Lleva toda una vida trabajando en el entorno de las imágenes. Su mirada y su ritmo se puede encontrar entre las páginas de importantes fotolibros firmados por artistas de la talla de Cristina de Middel, Joan Fontcuberta, Alberto García-Alix y Alessandra Sanguinetti. “Soy un intermediario entre la obra y su autor, entre la comunidad y las obras y también dentro del sistema”, opina el editor. Golpe ha publicado decenas de textos, los más recientes son los ensayos Curso Discurso y Atestado (Cabeza de Chorlito, 2020 y 2021, respectivamente). Junto a Marina Meyer y Sara Arroyo, es miembro de la plataforma educativa Ensambles, que actualmente está realizando foros de debate acerca la IA, y desde 2014 forma parte del colectivo gráfico La Troupe. When the wind es la primera obra de autor de Golpe. “Vengo de la palabra poética, de trabajar de forma obsesiva entre lo que media entre el lenguaje verbal y el visual, así que esta tecnología ha sido para mí una suerte de epifanía. Ahora puedo nombrar aquello que veo en mi interior y manifestarlo, materializarlo visualmente”, confiesa.

“Siempre he sentido el deseo de hibridar mi voz, de ir más allá de la palabra y hacer de la imagen algo más que un sonido elocuente que puede tomar una forma visual en la mente. Antes me servía de fotografías propias y de archivo para expandir mi escritura, pero me parecía extremadamente violento cuando aparecían personas, que en el fondo es lo que a mí me interesa. Hacer ficción con gente que no conozco, servirme de su imagen para contar mis historias siempre me pareció un acto de violencia, una usurpación. Ahora al menos sé que esas personas que recreo nunca existieron y eso me libera”, analiza Golpe.

Desde hace varios años, Golpe está dando forma a una investigación acerca del origen del lenguaje. Es un ensayo llamado Verba Volant, una conclusión a su búsqueda. “Me considero un gestor de distancias, tanto en la labor de editor como en la de profesor o comunicador”, opina.

Por qué la obra de la IA no es fotografía

La fotografía no reemplazó a la pintura. El cine no reemplazó al teatro. El vídeo no reemplazó al cine. La televisión no reemplazó a la radio. ¿Por qué temer que la IA reemplace a la fotografía?

Etimológicamente la palabra fotografía proviene del griego donde “foto” significa luz y “grafía”, escritura. Si la fotografía es el arte de escribir con luz, generar una imagen mediante texto que es enviado a una IA, ¿qué es? “Son imágenes sintéticas generadas de forma computacional a partir de un algoritmo. Nada de lo que muestran es real”, responde Golpe. Con la popularización de la IA se han acuñado nuevos términos, como syntograhpy (sintografía) y promtography, que aún no acaban de calar entre la sociedad. Ambos hacen referencia a la síntesis y a los textos (prompts), respectivamente, que el ser humano tiene que introducir para que la IA genere imágenes. Ese es el proceso: un cálculo computacional en función de una propuesta proposicional.

“En términos artísticos, lo veo como una herramienta más, no creo necesario distinguirlas de otras tecnologías visuales, pero cuando estas imágenes son tomadas como fotografías, es decir, como capturas de ‘la realidad’, su uso debería ser auditado por especialistas y referenciado. De todos modos, las fake news son solo unos de los usos deshonestos que se me ocurren, hay muchos otros y probablemente más perturbadores y nocivos”, zanja Gonzalo Golpe.