Ni pixelar tu cara te salvará de ser reconocido

Investigadores de la Universidad de Austin y el Cornell Tech de Nueva York logran desarrollar un software que identifica rostros y objetos a pesar de estar pixelados
Es una forma más de
machine learning
, un proceso por el cual una máquina aprende algo de forma autónoma

Una persona pixelada Izzyplante / Flickr

15 de septiembre de 2016 17:50 h

Como si se tratara de un perro al que amaestrar, un equipo de científicos del Cornell Tech de Nueva York ha entrenado a una máquina basándose en la prueba y el error. Es puro machine learning: imagen A que se corresponde con imagen B, así una y otra vez hasta que el sistema aprende por sí solo. Pero en esta ocasión, en vez de saber qué palabra va con cada imagen, el ordenador ha de adivinar la cara que había antes de ser borrada por cientos de píxeles.

Investigadores neoyorquinos, en colaboración con sus colegas de la Universidad de Austin (Texas), han entrenado un software para que reconozca rostros pixelados. “Las técnicas que hemos usado en este estudio son muy estándar en cuanto a reconocimiento de imagen”, resta importancia Vitaly Shmatikov en Wired. Él es uno de los integrantes del Cornell Tech que ha participado en el proyecto.

El software está enseñado para saber cómo se ha pixelado o difuminado una imagen a partir de lo que previamente ha visto o leído. Es capaz de saber el número de un portal en una foto de una calle pixelada o la cara difuminada de alguien. Y sin haber sido programado previamente para ello. Pero sí ha tenido que “verlo” antes. El machine learning ha hecho de las suyas: el software tan solo necesita un conjunto de imágenes y mucha observación.

Los investigadores han conseguido, a partir de redes neuronales, que el software reconozca imágenes después de haber sido modificadas con tres tipos diferentes de tecnologías. Una de ellas es la herramienta de difuminado de YouTube, una opción que da la web al subir un vídeo para difuminar aquellos elementos que se deseen. Otra ha sido mediante pura y dura pixelación y mosaico. Y la última, con una herramienta llamada Privacy Preserving Photo Sharing (P3), que encripta los datos de un JPG y genera una imagen parcial, comprimiendo los metadatos aparte para que puedan ser utilizados o enviados en un archivo de menor peso.

¿Cómo lo han hecho?

Modelando redes neuronales, basadas en el funcionamiento del cerebro humano. Los investigadores del Cornell Tech y la Universidad de Austin han diseñado esas redes para que identifiquen los datos contenidos en cuatro grandes bases de datos de imágenes. Cuantas más palabras, caras u objetos “ve” una red neuronal, mejores resultados tiene identificado esos items. Una vez que la red consiguió identificar con éxito el 90% de los objetivos, los investigadores pixelaron varios elementos con las tres herramientas antes mencionadas y entrenaron al software para interpretar esas imágenes difuminadas basándose en las originales.

Después utilizaron las imágenes pixeladas que aún no habían sido expuestas a la red neuronal para comprobar si el reconocimiento de imágenes era capaz de identificar caras, objetos o números escritos a mano. Objetivo cumplido: la red neuronal alcanzó tasas de éxito que excedían el 80 e incluso el 90% de acierto. El software se manejó continuamente en porcentajes entre el 50 y el 75% de coincidencia, aunque en un set de imágenes encriptadas con P3 de personajes famosos obtuvo un 17%.

Si hubieran puesto a los ordenadores a analizar caras, formas y números aleatoriamente, los investigadores calculan que las tasas de éxito para cada test habrían sido por lo menos de entre un 10 y un 15%. Esto significa que, incluso con unos porcentajes relativamente bajos de éxito, las máquinas aún estaban lejos de estar “adivinando”.

Etiquetas