Has elegido la edición de . Verás las noticias de esta portada en el módulo de ediciones locales de la home de elDiario.es.

Desarrollan un software capaz de recomponer lenguas antiguas

El programa automatiza el proceso que habitualmente realizan los lingüistas, aunque sin tanta exactitud

Pablo G. Bejerano

Investigadores de la Universidad de California, en Estados Unidos, y la British Columbia, en Canadá, han desarrollado un software capaz de recomponer lenguas antiguas a partir de las actuales. El minucioso trabajo que hacen lingüistas especializados, comparando palabras y encontrando similitudes en el léxico hasta llegar a la lengua de origen, ha sido reproducido por un programa informático.

El software recrea protolenguas o lo que serían reconstrucciones de las lenguas originales, ya perdidas, de las que se derivan los idiomas modernos actuales. Para una persona el trabajo consistiría en identificar patrones en los cambios de sonido. Con el paso de los años, al hablar, los fonemas van transformándose otros distintos.

“Estos cambios de sonido son casi siempre regulares, con palabras similares cambiando de formas similares, así que quedan patrones que un humano o un ordenador pueden encontrar”, señala el profesor de la Universidad de California, Dan Klein, uno de los autores del estudio (completo en PDF) presentado a raíz del proyecto.

La labor de los investigadores que quieren llegar hasta las formas primigenias de las lenguas actuales consiste en identificar los patrones de cambio y deshacerlos, es decir, aplicarlos en sentido inverso para dar con las palabras antiguas. Este proceso se repite con cada término. El algoritmo informático es capaz de automatizar esta función, procesando una gran cantidad de información y recreando cómo sería el léxico.

Los desarrolladores del software probaron la fiabilidad del sistema con 637 idiomas que se hablan en nuestros días en Asia y el Pacífico. A partir de ahí recompusieron la lengua original de la que son herederos. Comparando los resultados arrojados por el programa y los descubiertos previamente por los lingüistas, un 85% de las palabras reconstruidas de forma automatizada tuvieron sólo un margen de error de un carácter o fonema respecto a las concluidas por los expertos.

El software puede realizar este proceso de remontarse a la lengua primitiva a partir de una base de 142.000 palabras de un idioma actual.

Sin dejar de lado la labor de los expertos

La capacidad del programa no sustituye la labor de los lingüistas. El software es capaz de procesar grandes cantidades de información en poco tiempo, pero sus resultados no ofrecen una precisión total. Sigue siendo necesaria la labor de un experto para discernir qué palabras estarían recompuestas correctamente, cuáles no encajarían del todo y qué porcentaje habría que descartar por entero.

El profesor Klein indica que el sistema no funciona correctamente con cambios morfológicos en las palabras ni con términos duplicados. Además, no proporciona una explicación sobre por qué se producen los cambios y cómo es la evolución. Sólo muestra el origen probable del léxico.

Imagen: Tilemahos Efthimiadis

Etiquetas
stats