¿Google no te entiende? Así puedes entrenar a tus altavoces inteligentes para que te reconozcan

Asistentes digitales: cómo entrenarlos.

Martín Frías

3

“Alexa, apaga la luz del salón” es una orden suficientemente sencilla, pero tu altavoz inteligente puede que lo entienda solo a veces, y te responda “buscando alquiler de camión”. Aunque hace unos años parecían ciencia ficción, hoy es normal usar reconocimiento de voz en muchos sistemas, incluyendo los servicios telefónicos de atención al cliente (otros que funciona solo a ratos). 

Cada vez que decimos su nombre, los asistentes digitales como Alexa, Google Assistant o Siri graban la voz y envían la grabación digital por internet a la nube, donde el sonido se analiza con algoritmos de procesamiento del lenguaje natural (PLN). Esto implica dos pasos: por un lado, el reconocimiento de voz, que transforma los datos de audio en palabras. Por otro, la comprensión del lenguaje, donde se interpreta el significado de las palabras. 

Estos sistemas están diseñados para reconocer diferentes acentos, dialectos y variaciones en la pronunciación, pero no es fácil acertar a la primera. Pensemos por ejemplo en variaciones fonológicas como el seseo, en el que la ce de “luces” suena como una ese o en los acentos que omiten la ese final. ¿Cómo pueden distinguir los asistentes estas variaciones y aún así terminar acertando? 

El aprendizaje automático

Los asistentes ofrecen la posibilidad de aprender y reconocer voces y variaciones en la pronunciación específicas con el tiempo. Para ello utilizan algo llamado aprendizaje automático (Machine Learning). Esta rama de la inteligencia artificial permite a los sistemas informáticos aprender y mejorar a partir de la experiencia sin programarlos de nuevo cada vez. Consiste en identificar patrones en los datos y esperar ese resultado en el futuro, en este caso, un tono de voz, acento o cadencia para hablar con el altavoz inteligente de casa.

Por eso, cuando Google o Alexa no te entiendan o respondan algo que no tiene que ver, aunque estés tan cabreado que quieras gritarle, no lo hagas. Gritar a tu altavoz inteligente hace más difícil que te entienda. En su lugar, la mejor forma de que aprendan es seguir usando el tono normal de voz, el mismo que usaríamos cualquier día para pedirles que nos digan qué tiempo hace fuera.

Otro factor importante es colocar el altavoz en un lugar donde el micrófono no esté bloqueado por muebles u otros obstáculos (no lo coloques dentro de un armario) y lejos de fuentes de ruido ambiental, como un aparato de aire acondicionado o una ventana abierta a una calle ruidosa. 

Si quieres que aprendan a reconocer tu uso normal del lenguaje, tienes que hablar a tu altavoz inteligente de forma normal. Que estés hablando con una máquina no significa que tú tengas que hablar como un robot. Por ejemplo, en lugar de decir algo como “Alexa, alarma siete”, di “Alexa, pon la alarma mañana a las siete” y el asistente digital entenderá exactamente lo que quieres.

Cómo hacer que Alexa, Google Assistant y Siri te entiendan mejor

El altavoz Echo de Amazon está diseñado para trabajar con hasta seis personas distintas, que pueden hablan con acentos diferentes, o bien con niños en distintas etapas de desarrollo del lenguaje. Aunque con el tiempo aprenderá a reconocer a las distintas personas del hogar por su voz, puedes configurar de antemano los distintos perfiles de Alexa usando la aplicación móvil:

Para configurar a una nueva voz, pulsa el botón 'más' y selecciona 'configuración'. Selecciona ahora 'tu perfil', y junto a 'tu familia', pulsa 'añadir a alguien más'. Introduce el nombre de la persona y dale tu teléfono para que siga las instrucciones. Echo pedirá que repita palabras en voz alta para aprender su tono de voz y pronunciación. A partir de ese momento, cuando una de las personas registradas hable con el altavoz, le responderá diciendo su nombre para indicar que la reconoce.

Si es Siri quien no te entiende, intenta entrenar al asistente digital de Apple yendo a los ajustes de tu iPhone o iPad y tocando en 'Siri' y 'búsqueda'. Activa y desactiva la opción escuchar 'oye, Siri'. Sigue las instrucciones que aparecen en pantalla para que Siri reconozca tu voz. También puedes entrenar a Siri para que pronuncie correctamente los nombres de las personas de tu familia. Si Siri dice mal un nombre, dile “lo has pronunciado mal” para enseñarle la pronunciación correcta.

Google Assistant tiene una función similar llamada Voice Match que enseña al sistema a reconocer tus órdenes. Para configurar esta función, abre la app Google Home, toca tu foto de perfil o tus iniciales y después 'ajustes del asistente > coincidencia de voz'. Aquí puedes pulsar en 'añadir dispositivos' y seguir las instrucciones en pantalla.

También puedes hacer que Google Assistant, Siri y Alexa sean más inteligentes respondiendo cada vez que uno de los asistentes digitales te pida aclaraciones sobre algo que hayas dicho. Puede que no te apetezca responder al asistente virtual cuando se equivoca, pero al hacerlo ayudas a entrenar al altavoz para que te reconozca mejor la próxima vez.

Como ocurre con los niños (y los adultos), es necesario tener paciencia para que te entiendan mejor. De este modo es menos probable que tengas que repetirle la próxima vez.

Etiquetas
stats