RTVE implanta un software de investigadores de la UC3M para el subtitulado en directo de informativos
Un software desarrollado por investigadores de la Universidad Carlos III de Madrid ha sido implementado en diez de los 17 centros territoriales de RTVE para el subtitulado en directo de sus informativos territoriales. Este sistema pretende mejorar la comunicación de los cerca de cuatro millones de personas con discapacidad auditiva en España, según han recogido desde la Universidad en un comunicado.
El grupo de investigación SoftLab de la UC3M ha implementado un sistema completamente autónomo para el subtitulado automático y en tiempo real, mediante técnicas de inteligencia artificial y machine learning (aprendizaje automático). El propio software realiza la transcripción de voz a texto y la envía al sistema de insertado de subtítulos que la corporación tiene en Torrespaña. Esta, a su vez, deriva la información a cada uno de sus centros para que cada autonomía pueda ver los subtítulos correspondientes en función del contenido audiovisual que esté emitiendo.
“Cuantas más emisiones genere el sistema, más preciso será”
“La arquitectura puede soportar un gran número de generación y transmisión de subtítulos simultáneas sin afectar a la calidad o velocidad del subtítulo de cada emisión. El proceso de subtitulado retroalimenta al reconocedor, de modo que cuantas más emisiones genere el sistema de subtítulos, más preciso será en las futuras emisiones”, ha explicado el director de SoftLab, Ángel García Crespo.
Al contrario del actual sistema de 'rehablado', que sigue en vigor y que precisa de una persona que introduzca y envíe la transcripción, el desarrollado por la UC3M realiza todo el proceso en la nube y no necesita prácticamente intervención humana, infraestructura o ubicación concreta.
“El sistema analiza los resultados en tiempo real de varios reconocedores de voz y construye la transcripción final con resultados superiores al resultado de forma individual de cada uno de ellos”, ha apuntado García Crespo.
Este software respeta las normas de subtitulado y escribe en una o dos líneas un máximo de 37 caracteres, tal y como exige la normativa. Además, incluye automáticamente signos de puntuación e identifica términos propios de cada zona, que se han añadido de forma individual por territorio para conseguir una transcripción más eficaz y reducir los errores que suelen producir otros sistemas similares.