Resultados electorales, inteligencia artificial y encuestas
Recientemente se han publicado los resultados de un “sondeo electoral diferente” que, utilizando Inteligencia Artificial para el análisis de sentimiento de más de 80.000 cuentas de Twitter de Santa Cruz de Tenerife pronosticaba una posible victoria del PSOE en las elecciones municipales de mayo de 2023. El autor del estudio defendía este nuevo tipo de “sondeo electoral” frente a los tradicionales aduciendo que “se tiene más conocimiento de una persona por lo que ha estado pensando y dejando plasmado en los últimos cinco años que por lo que le puedas preguntar [en una encuesta]”. Y se argumentaba en el artículo que el hecho de que el estudio realizado por una contrastada empresa de investigación sociológica, el tipo de entidades que suelen encargarse de los estudios electorales, diera resultados distintos a los suyos, prediciendo una posible victoria de los partidos de derecha, se debía a que la intención de voto posiblemente había cambiado desde que se realizó el “sondeo tradicional”, entre finales de 2022 y principios de 2023, debido al pufo del museo Rodin en la capital tinerfeña.
Desde que el término “Data Science” (como si hubiera una ciencia que se basa en los datos y otra que se basa en las revelaciones del Espíritu Santo…) se ha vuelto una de las palabras de moda, circula a menudo la idea de que la Ciencia tiene que ver sólo con datos y no con teorías, bajo la presuposición de que cuando existen suficientes datos no hacen falta teorías para interpretar la realidad, la realidad social en el caso que nos ocupa. El analfabetismo teórico de ciertos estudios, que se realizan sin un mínimo estudio de las áreas que pretenden explicar, les lleva a no darse cuenta de que, sin saberlo, están utilizando teorías para realizar sus análisis “empíricos”, lo que pasa es que en vez de basarse en teorías científicamente contrastadas del área sobre el que pretenden aportar algo están usando teorías populares. Como sociólogo y profesor de técnicas cuantitativas de investigación social me parece una teoría un tanto arriesgada decir que nuestro ideología y comportamiento político se captan mejor por lo que podamos expresar en Internet que por lo que puedan revelar cuestionarios cuidadosamente realizados por personas expertas en la materia. Pero lo que ya directamente no concuerda para nada con los conocimientos acumulados en las últimas décadas por los estudios de ciencia, tecnología y sociedad (Science, Tecnhology and Society en inglés) es la teoría en que se basa el estudio aludido: que existe relación entre el voto de los ciudadanos de un municipio y los sentimientos que pueden asociarse a las publicaciones en Twitter relativa a los distintos partidos. Empecemos por los conceptos de universo y muestra, tan habituales en los sondeos tradicionales. ¿Estamos seguros de que las 80.000 cuentas analizadas en Santa Cruz de Tenerife corresponden con ciudadanos distintos y con derecho a voto en dicho municipio? Podría ser que una persona tuviera más de una cuenta; podría ser que la persona que twitea no tenga 18 años, ni, por tanto, derecho a voto; podría ser que sean de personas extranjeras y sin derecho al voto; o, aún, es más, pudiera ser que esas personas tuvieran derecho al voto en las municipales, pero en otros municipios. Pero vayamos ahora al mundo del comportamiento humano en las redes: puede que un análisis de redes neuronales, de sentimientos o alguna otra técnica de nombre complicado y que desconozco (no tienen que ver con mi área de conocimiento) nos revele un sentimiento muy negativo en las redes hacia Coalición Canaria tras el pufo del museo Rodin. ¿Pero, acaso no es una teoría “pseudo sociológica” afirmar que eso tiene que ver con el comportamiento de las personas dentro de tres meses a la hora de ir a votar? Quizá dos haters pueden generar mucho odio hacia un partido, y de alguna forma influir en la opinión pública. Pero, a la hora de votar, no son más que dos votos. Y por más que tu cuñado, acérrimo enemigo de un determinado partido y adicto compulsivo a las redes pueda llegar a representar, en términos de porcentajes de los post sobre política que se escriben en tu municipio, un 5%, en términos de votos no llega al 0,5%. Por otro lado, muchas personas de cierta edad que son fieles votantes de un determinado partido no usan redes, así que ni siquiera enteran de ese “clima” que estos estudios captan y que supuestamente va a influir en su voto.
Cuando se estudia Sociología se aprende una cuestión clave: no hay que confundir correlación de variables con causalidad, sino que hay que buscar los mecanismos explicativos de los fenómenos sociales, es decir, desarrollar teorías que permitan comprender por qué pasa lo que pasa. También que, dado que la realidad social es muy cambiante, es necesario estar constantemente realizando estudios para intentar aproximarnos a su conocimiento. Sí, ciertamente, desde diciembre de 2022 hasta ahora han sucedido acontecimientos lo suficientemente relevantes como para pensar que es necesario revisar si los sondeos realizados entonces siguen teniendo vigencia. Pero lo que se ha presentado como un “sondeo electoral diferente”, implícitamente incluso como mejor, por no ser una técnica reactiva basada en las preguntas de una encuesta, sino en lo que la gente dice “espontáneamente” en Twitter, no me parece que ayude mucho a conocer la realidad social del comportamiento a la hora de votar. Estoy convencido de que los nuevos métodos relacionados con los recientes desarrollos informáticos permitirán mejorar los métodos tradicionalmente usados para estudiar la sociedad. Pero siempre y cuando se parta desde el conocimiento ya acumulado por las Ciencias Sociales, y no desde el desprecio a siglos de esfuerzo colectivo. Claro que, como ya publiqué en este mismo medio, al menos en Ciencias Sociales (que es lo que yo conozco) los estudios a veces se hacen (y se publican) más que para extraer información de la sociedad para inyectar información en ella.