Por qué un robot que entienda todos los idiomas sigue siendo cosa de Star Wars

El entrañable C-3PO domina seis millones de formas de comunicación, mientras que Skype Translator controla siete idiomas por todo lo alto. ¿Será posible que las máquinas traduzcan todas las lenguas algún día? ¿Por qué el traductor de Google sigue cometiendo tantos fallos? La dependencia de textos adaptados por humanos y las limitaciones tecnológicas son los principales obstáculos.

C3-PO dominaba seis millones de formas de comunicación. Google Traductor, 90 idiomas

28 de enero de 2016 11:54 h

George Lucas ideó hace casi cuatro décadas un droide de protocolo capaz de dominar seis millones de formas de comunicación. Por muy repelente que nos siga pareciendo a veces el bueno de C-3PO, lo cierto es que su capacidad para entender a otros seres ha servido para sacar a los personajes de 'La guerra de las galaxias' de algún que otro apuro.

Años antes de que el creador de la famosa saga intergaláctica imaginara al pedante autómata o de que la tripulación de la nave Enterprise se comunicara con los alienígenas en 'Star Trek' mediante un traductor universal, los investigadores de IBM confiabanIBM en desarrollar rápidamente una máquina que entendiera varios idiomas. Hablamos de la década de los 50.

Sin embargo, en la actualidad, Skype Translator, el C-3PO de Microsoft, está disponible en siete idiomas, medio centenar para sus mensajes instantáneos. Mientras, el famoso Google Translate ofrece traducciones en 90 lenguasofrece traducciones en 90 lenguas. Si se calcula que existen unas siete mil lenguas en el mundo y los sistemas actuales siguen metiendo la pata con los que ya incluyen (con casos tan sonados como el “festival del clítoris” que, según los de Mountain View, se iba a celebrar en Galicia), parece evidente que la traducción automática no va a ser perfecta a corto plazo. Ahora bien, ¿conseguiremos en los próximos años el ansiado traductor universal?

PRIMERO TE ESCRIBO Y LUEGO TE TRADUZCO

Hace un año que Skype presentó su novedosa herramienta para traducir conversaciones de voz al chino, inglés, francés, alemán, italiano, portugués y español. En realidad, el sistema no traduce automáticamente la charla. Según explicó Gurdeep Pall, el vicepresidente de Skype, el 'software' combina un sistema reconocimiento de voz con otro de traducción automática. Cada intervención se pasa a texto y el sistema la traduce después, aunque todo suceda asombrosamente rápido.

Es precisamente en la primera fase del proceso en la que Skype Translator ha supuesto un gran avance. El programa utiliza el famoso 'deep learning''deep learning', las redes neuronales profundas, para lograr que una tertulia se transforme en palabras escritas de una forma mucho más eficiente.

“Se puede construir un sistema que tiene el mismo estado del arte en temas de reconocimiento de voz sin tener que hacer nada, todo lo hace la red neuronal, es capaz de 'comprender' desde la propia señal”, explica a HojaDeRouter.com Francisco Casacuberta, catedrático e investigador del Centro Pattern Recognition and Human Language Technology de la Universidad Politécnica de Valencia.

Las redes neuronales profundas realizan todas las fases del proceso por sí mismas y, además, perfeccionan progresivamente el sistema a medida que Skype las entrena con las conversaciones que graba de los usuarios. Así, el innovador sistema que traduce nuestras videollamadas va haciendo cada vez mejor su trabajo.

EL 'QUID' ESTÁ EN LOS DATOS

Cuando Skype ya tiene el texto en su sistema, lo traduce con ayuda de Bing Translator. Al igual que el traductor de Google o que el sistema de código abierto Moses (financiado por el Programa Marco de I+D de la Unión Europea y que ahora utilizan muchas empresas e investigadores), Bing Translator se basa en modelos de aprendizaje automático estadísticos.

Estos sistemas ni han estudiado traducción e interpretación ni tampoco son expertos lingüistas. Para realizar su labor, memorizan las traducciones de millones de documentos realizadas por humanos en los dos idiomas requeridos, ya que se pueden fiar de ellos. No utilizan todo internet, sino solo la parte de la Red traducida por expertos.

A partir de ahí, la estadística es la clave. En lugar de responder a nuestras peticiones traduciendo palabra por palabra, la máquina analiza qué probabilidad hay de que una secuencia de vocablos en una lengua se corresponda con una traducción determinada, teniendo en cuenta además el contexto global.

Por eso Google Translate sabe que el significado de 'work' puede variar en base a quién realiza la acción, si es una máquina o una persona, y aunque no tenga ni idea de gramática, sabe que los adjetivos van delante de los sustantivos en inglés. Así, intenta traducir primero y ordenar después las piezas del puzle de cada frase calculando la frecuencia con la que han aparecido ordenadas de esa misma forma en textos memorizados previamente. Como la máquina no entiende de verdad lo que está traduciendo, sino que tira de estadística, tenemos que seguir lamentando sus fallos.

Poco a poco, se espera que las redes neuronales sean también más precisas que los tradicionales modelos estadísticos. En su caso, transforman cada combinación de palabras en un vector capaz de representar si “banco” es un asiento del parque, un grupo de peces o una entidad financiera.

Pese a ello, la eficacia de las redes neuronales también depende de la disponibilidad de textos traducidos. “Aunque tengas una revolución copernicana en la tecnología, dependerás todavía de textos traducidos para diferentes pares de lenguas”, defiende Núria Bel, investigadora del Instituto Universitario de Lingüística Aplicada de la Universidad Pompeu Fabra.

Así que, para crear un hipotético C-3PO, no solo es necesario mejorar infinitamente su cerebro robótico, sino que el verdadero reto es llenarlo de textos y traducciones. “Es como diseñar un Fórmula 1 sin gasolina. Los datos, las traducciones, son como la gasolina que hace funcionar el motor”, ejemplifica Bel.

POR QUÉ RUSIA ERA MORDOR

El traductor de Google y otros sistemas recurren a documentos de Naciones Unidas o de la Unión Europea y rastrean la Red en busca de textos multilingües. Obviamente, hay combinaciones de lenguas entre las que es imposible encontrar textos traducidos por expertos humanos o bien los documentos que se encuentran no son suficientes.

En los casos en que no dispone de textos basados en unos determinados pares de lenguas, Google Translate utiliza una lengua como intermediaria o pivotecomo intermediaria: transforma el texto al inglés, del que hay más documentos traducidos a cualquier lengua, y posteriormente al idioma deseado. Esto puede explicar por qué es capaz de respetar el género cuando traduce “profesora” al catalán pero no cuando traduce ese término al alemán. La criba que realiza la lengua de Shakespeare acaba provocando un notable descenso en la calidad.

Además, un sistema de traducción automática difícilmente se ha entrenado con todas las palabras que forman un idioma, por lo que, de vez en cuando, deja una palabra sin traducir o rellena el hueco con ayuda de un atajo. “Cuando una palabra es desconocida, se intenta ver su contexto y producir la traducción. Se puede acertar o no, pero siempre será menos malo que no hacer nada”, explica Casacuberta. La colaboración entre el humano y la máquina es otra de las soluciones. De hecho, Google pide ayuda a la comunidad para traducir y corregir los textos y mejorar así su sistema.

Estas triquiñuelas podrían justificar que el imparcial traductor de Google tradujera la Federación de Rusia como Mordor del ucraniano al ruso, y convirtiera al ministro de Exteriores en un “pequeño caballo triste”. Al fin y al cabo, Ucrania no estaba nada contenta con la anexión de Crimea y se puede deducir que lo plasmaron en la Red, la fuente de la que beben sus adaptaciones.

Problemas como estos podrían resolverse si los sistemas contaran con los suficientes documentos traducidos. Todo un desafío si tenemos en cuenta que, según un informe de la Broadband Commission, unos 1.500 idiomas están en peligro de extinción, en internet solo están representadas el 5 % de las lenguas y el 55,2 % de las webs están en inglés.

Los investigadores necesitan más datos para construir a C-3PO y la mayoría de veces solo disponen de ellos cuando hay una verdadera necesidad. Sin ir más lejos, durante el terremoto de Haití se creó un improvisado sistema de traducción del criollo haitiano al inglés para que el ejército estadounidense entendiera los mensajes de emergencia.

En España, se presentó hace unos meses el Plan de Impulso de las Tecnologías del Lenguaje para promover, entre otros aspectos, la traducción automática en las Administraciones Públicas. Ahora bien, hablar del desarrollo de sistemas perfectos es otro nivel.

CÓMO HACER QUE UN TRADUCTOR ENTIENDA FÍSICA CUÁNTICA

Aunque Google Translate o Skype Translator funcionen decentemente como traductores de propósito general, todavía es un reto conseguir buenas traducciones sobre ciertos temas y en ciertos idiomas. “Lo que hace el traductor de Skype es modelar: hace modelos estadísticos o de redes neuronales sobre un dominio específico. Si estamos hablando de viajes, la cantidad de veces que una palabra será la traducción de otra se puede estimar mejor porque tienes menos cosas entre las que elegir”, explica Núria Bel.

Además de utilizar Bing Translator, la compañía propiedad de Microsoft ha añadido al sistema “una capa de palabras y frases” que solemos usar en los diálogos, para lo que han utilizado ejemplos de las redes sociales. Por eso Skype logra reconocer y traducir bastante bien las conversaciones: todos utilizamos un lenguaje coloquial en nuestras videollamadas o hablamos de cosas similares.

Sin embargo, hay otros temas de conversación en los que el sistema no es tan eficiente: un estadounidense trató de leer a un chino la definición de la eficiencia de Pareto sin buenos resultados, si bien Skype Translator fue capaz al menos de traducir el término.

“Tendremos traductores muchos mejores entre el inglés y el español para temas de economía, pero nunca serán capaces de traducir entre el pitjantjatjara y el euskera sobre temas de física, porque probablemente no hay ni un sólo par de documentos online que sean dos versiones, en esos idiomas, del mismo texto sobre física”, explica Julio Gonzalo, profesor del Departamento de Lenguajes y Sistemas Informáticos de la UNED.

Precisamente esa dificultad de algunos sistemas generales de traducción automática ha hecho que algunas empresas se especialicen en áreas muy concretas, como la traducción de prospectos médicos. Cuanto más delimitados están los temas, más acertado puede ser su modelo estadístico.

Hace unos meses, la compañía Elan Languages demostró que la traducción de una receta del japonés al inglés con su sistema superaba a la del gigante de Mountain View. Ahora bien, ¿es mejor tecnológicamente su programa o es simplemente que habían utilizado un mayor número de documentos sobre recetas en japonés para entrenarlo?

¿JAMÁS TENDREMOS UN C-3PO EN EL PLANETA TIERRA?

La disponibilidad variable de datos según los pares de lenguas, la temática y la dificultad de aprendizaje de la traducción automática hacen sospechar a Julio Gonzalo, investigador de la UNED, que la “traducción universal perfecta entre idiomas al estilo de C-3PO será una quimera todavía por mucho tiempo”.

Francisco Casacuberta también se muestra escéptico sobre la posibilidad de conseguir un droide de protocolo como el inseparable acompañante de R2-D2. “Los sistemas no son perfectos ni lo van a ser. Estoy convencido de que traducir una novela es imposible, porque es un proceso artístico. El traductor humano debe conocer no solamente las dos lenguas como si fuesen suyas, sino el autor, la obra, el contexto...”

Por el momento, Casacuberta cree que pueden mejorarse los sistemas conocidos. Por ejemplo, los sistemas de reconocimiento de voz podrían generar miles de transcripciones diferentes que sirvieran como “hipótesis alternativas” para el traductor automático, en lugar de realizar una única transcripción. De esta forma, el traductor podría decidir cuál es la más adecuada y acertaría en más ocasiones.

Núria Bel, por su parte, está investigando con su grupo de la Universidad Pompeu Fabra cómo producir automáticamente recursos que sirvan para entrenar a los algoritmos sin depender exclusivamente de documentos traducidos profesionalmente. ¿Queremos adaptar un catálogo de mobiliario del catalán al inglés? Seleccionamos dos, uno en cada idioma, y encontramos la equivalencia de palabras a partir de una representación semántica para crear un nuevo diccionario bilingüe.

Bel sugiere otra línea de investigación que podría dar sus frutos en un futuro: utilizar revolucionarios sistemas que no dependan de las traducciones que les enseñen los maestros humanos, sino que aprendan por sí mismos. Sin embargo, esta tecnología no ha dado todavía buenos resultados. “El [traductor universal] no es imposible, parece que lo que necesitamos es tiempo para desarrollar otra tecnología y evitar la dependencia de datos traducidos”, señala esta investigadora.

Mientras tanto, C-3PO nos seguirá superando cuantitativamente al dominar seis millones de formas de comunicación. Eso sí, él mismo no sabía exactamente lo que le decían los 'ewoks' en su primitivo dialecto, pero le bastaba para comprender que le consideraban un dios. Si al menos se consiguiera descubrir un sistema que entendiera más o menos una gran cantidad de idiomas, aunque siguiéramos quejándonos de los fallos de la máquina, ya sería un gran paso que, a corto plazo, no parece que vayamos a dar.

---------------

La imagen es propiedad de Horian VarianHorian Varian

Etiquetas