Sunlight lucha contra la opacidad de los gigantes online
Muchas compañías recogen información de los consumidores en internet para realizar campañas de publicidad personalizadas. Este es el motivo por el que muchas veces vemos anuncios de productos relacionados con búsquedas recientes e incluso con el contenido de algún correo electrónico. El problema es que desconocemos quién y cómo gestiona estos datos, y lo más importante, qué se hace con ellos.
Ahora, una nueva herramienta, llamada Sunlight, promete traer algo más de transparencia a la red, ofreciendo información a los usuarios sobre qué datos obtenidos de sus cuentas son utilizados para mostrarles anuncios, productos u ofertas personalizadas. “Sunlight pretende arrojar luz sobre el opaco ecosistema de datos en línea”, aseguran sus desarrolladores en el estudio que ha sido presentado en la Conferencia sobre Seguridad Informática y Comunicaciones.
El heredero de XRay
Este era el objetivo de otra herramienta también desarrollada por el mismo equipo de investigadores, XRay. Sin embargo, según Augustin Chaintreau, uno de los desarrolladores de Sunlight, la anterior versión “era como un médico que sólo te puede garantizar que acertará en algunos diagnósticos”. Algo que aseguran haber resuelto con Sunlight. “Puede que Sunlight no nos de siempre una respuesta, pero ahora estas respuestas son mucho más fiables”, afirma este investigador del Instituto de Ciencia de Datos de la Universidad de Columbia (EEUU).
Todas las herramientas de control de datos funcionan de una forma similar. Se hacen una serie de pruebas con cuentas creadas para este objetivo y se recopila información sobre los anuncios que reciben. “Si, por ejemplo, las cuentas con las que hemos escrito correos con la palabra coche empiezan a recibir anuncios de seguros, es que la compañía está rastreando esta palabra clave para personalizar sus anuncios”, explica Chaintreau.
Para desarrollar Sunlight los investigadores crearon 119 cuentas de Gmail y enviaron 300 correos electrónicos con palabras clave, tanto en el asunto, como en el cuerpo del mensaje. Gracias a los datos recopilados y por medio de técnicas de aprendizaje automático, Sunlight podrá hacer un rastreo de la red e identificar la posible relación entre un anuncio y una palabra clave contenida en un correo.
Google incumple sus propias políticas sobre publicidad
Finalmente, con los datos obtenidos por esta herramienta se pudo observar que alrededor del 15 por ciento de los anuncios estaban personalizados y relacionados con las palabras clave utilizadas. Además, los investigadores concluyeron que algunos de estos anuncios contradecían la propia política de Google de no orientar sus espacios publicitarios por cuestiones de raza, religión, orientación sexual, salud o categorías financieras sensibles. Según los resultados obtenidos por Sunlight, “las cuentas que mostraban síntomas de depresión en sus correos recibían publicidad sobre grupos de apoyo, sobre programas públicos contra el acoso escolar o sobre empresas que investigan infidelidades”, asegura Chaintreau.
Los investigadores también crearon varios perfiles de navegación y fueron entrando en diversas webs para ver qué anuncios aparecían. En este caso, sólo el 5 por ciento de los anuncios parecía estar personalizado, pero aún así, varios de ellos también parecían violar la normativa de publicidad de Google. En este caso, sobre los anuncios dirigidos al consumo de productos y servicios que faciliten el uso de drogas, ya que una visita a un portal sobre el uso recreativo de la marihuana desencadenó un anuncio de una compañía que ofrecía pipas de agua.
Sin embargo, pese a que las evidencias muestran los incumplimientos de las políticas sobre publicidad, los investigadores insisten en señalar que la atribución de anuncios no tiene por que ser intencional, dado que la complejidad de los datos hace que no sea posible para una empresa controlar cada anuncio.
Los limites éticos del uso de datos
Con respecto a los límites éticos de utilizar los datos de los consumidores, Chaintreau reconoce “que no es capaz de dar una respuesta”, pero tiene claro que uno de los límites que no se debería traspasar es el de la transparencia. “No es éticamente aceptable utilizar datos de los consumidores y al mismo tiempo ocultar la fórmula que has utilizado para manejar esos datos”, asegura este investigador.
Los desarrollares de Sunlight creen que es fundamental que durante los próximos años se produzca un debate más “profundo y equilibrado sobre la transparencia en la red”, dado que nos encontramos en “plena transición a un mundo impulsado por los datos”. Según Chaintreau, “pronto estaremos compartiendo tantos datos con empresas que todo el mundo va a necesitar herramientas como ésta y del mismo modo que cuando vamos a hacer obras en casa no firmamos nada hasta ver un presupuesto, en el futuro no revelaremos nuestros datos a una compañía sin tener una idea clara de lo que va a suceder con esos datos”.
Paradójicamente el proyecto Sunlight se ha financiado con dinero proveniente de los grandes nombres del sector tecnológico, como Google, Yahoo o Microsoft, tal y como reconocen los propios investigadores en su estudio.