¿De qué ‘hablan’ los cachalotes? La inteligencia artificial ayuda a intentar descifrar sus vocalizaciones
Los cachalotes tienen los cerebros más grandes del reino animal y un sofisticado comportamiento social en el que los miembros de familias y grupos culturales intercambian una serie de clics para comunicarse y localizar a sus presas. Hasta ahora se había demostrado que algunos de estos clics comunicaban su identidad, como si cada uno tuviera un nombre propio, pero el hallazgo del equipo de Pratyusha Sharma va mucho más allá: la inteligencia artificial les ha permitido demostrar que las vocalizaciones de estos animales son más complejas de lo que se pensaba y contienen estructuras similares a la fonética humana.
Para el trabajo publicado este martes en la revista Nature Communications, Sharma y su equipo del Laboratorio de Ciencias de la Computación e Inteligencia Artificial (CSAIL) del MIT y el Proyecto CETI (Iniciativa de Traducción de Cetáceos) han analizado las vocalizaciones de unos 60 cetáceos que viven en grupos en el Caribe Oriental mediante sistemas de aprendizaje automático. Los autores afirman haber decodificado por primera vez lo que llaman el “alfabeto fonético del cachalote”, que permite empezar a descifrar sus comunicaciones, aunque todavía se desconocen sus contenidos.
“Las breves ráfagas de clics que estos cetáceos utilizan para comunicarse entre sí tienen tanto una estructura combinatoria como una modulación de llamada dependiente del contexto”, explica Sharma a elDiario.es. “Los sistemas de vocalización combinatoria son raros y su presencia indica que, en principio, la especie es capaz de representar un espacio más amplio de mensajes”.
Estos cetáceos se comunican mediante codas, lo que nos ayuda a comprender cómo pueden codificar información en sus llamadas
Los investigadores analizaron hasta nueve mil codas, recopiladas de familias de cachalotes del Caribe Oriental observadas por el Proyecto Dominica Cachalotes, mediante una combinación de algoritmos para el reconocimiento y clasificación de patrones, así como equipos de grabación corporal. Y resultó que las comunicaciones de los cachalotes no eran aleatorias ni simplistas, sino que estaban estructuradas de una manera compleja y combinatoria.
Las codas que cambian el significado
La base del sistema de comunicación está en lo que los científicos han bautizado como codas, breves ráfagas de clics que varían significativamente en estructura según el contexto conversacional. “Los cachalotes se comunican mediante sonidos de clics y sus llamadas de comunicación se realizan reuniendo un paquete corto de clics”, explica la investigadora principal. “Comprender qué aspectos de estas codas pueden controlar y variar nos ayuda a entender cómo pueden codificar información en sus llamadas”.
El resultado, añade la autora principal, muestra que estas codas no son aleatorias, sino que se crean mediante un cuidadoso ensamblaje de cuatro características: ritmo, tempo, rubato (variación gradual de una misma coda) y adornos (un “clic adicional” añadido al final de una coda en un grupo de señales más cortas). “Descubrimos que los cachalotes pueden modular una característica (duración general) de su llamada mientras mantienen fija la otra (ritmo)”, asegura Sharma. “Tienen estos clics adicionales, que llamamos adornos, que se colocan encima de diferentes codas. Estos ocurren más hacia el principio y el final de los turnos en un intercambio, comportándose como marcadores del discurso”.
Matices y variaciones individuales
Los experimentos se llevaron a cabo utilizando etiquetas biológicas acústicas para identificar los intrincados detalles de los patrones vocales de estos animales. Al desarrollar nuevas técnicas de visualización y análisis de datos, los investigadores del CSAIL descubrieron que los cachalotes individuales podían emitir varios patrones de coda en intercambios prolongados, no sólo repeticiones de la misma coda. Estos patrones, dicen los autores del estudio, tienen matices e incluyen variaciones detalladas que otros cachalotes también producen y reconocen.
Nos estamos aventurando hacia lo desconocido, para descifrar los misterios de la comunicación de los cachalotes sin ningún dato real preexistente
El parecido con el lenguaje complejo de los humanos, explica Sharma, viene de la forma en que emplean dos propiedades, el contexto y la combinatoria. La primera se manifiesta al comprobar que algunos aspectos de las llamadas de los cachalotes sólo se vuelven evidentes en el contexto comunicativo más amplio. “En los humanos, el tono del habla tiene una variación contextual”, indica. “En los cachalotes es el rubato y el adorno los que se hacen evidentes en el contexto comunicativo más amplio”.
En cuanto a la combinatoria, prosigue, los humanos combinan sonidos como “æ”, “p”, “l” y “ə” que no significan nada por sí mismos, para producir palabras como “apple” (manzana) que transmiten significado. A partir de entonces, podemos secuenciar palabras para crear oraciones, como La manzana roja está sobre la mesa, para transmitir significados más complejos. “Lo que vemos en los cachalotes es que también hay una combinación de dos niveles de características que llamamos ritmo, tempo, rubato y adorno para formar codas, que luego se secuencian en intercambios”, asegura. “Todavía no sabemos a qué nivel y qué características significan llevar o incluso de qué están hablando. Aún así, vemos que tienen un mecanismo combinatorio mediante el cual ensamblan llamadas y, en principio, son capaces de ampliar el espacio del mensaje”.
Intenciones comunicativas específicas
El uso del aprendizaje automático ha sido esencial para identificar las características de sus comunicaciones y tratar de predecir lo que dirán a continuación. “Nos estamos aventurando hacia lo desconocido, para descifrar los misterios de la comunicación de los cachalotes sin ningún dato real preexistente”, dice Daniela Rus, directora del MIT CSAIL y coautora del trabajo. “Nuestros hallazgos indican la presencia de contenido de información estructurado y también desafían la creencia predominante entre muchos lingüistas de que la comunicación compleja es exclusiva de los humanos”.
A juicio de Rus, este es un paso para demostrar que otras especies tienen niveles de complejidad comunicativa que no han sido identificados hasta ahora y que están profundamente conectados con el comportamiento. “Nuestros próximos pasos apuntan a descifrar el significado detrás de estas comunicaciones y explorar las correlaciones a nivel social entre lo que se dice y las acciones grupales”, apunta.
Los autores admiten que siguen desconociendo en gran medida qué es lo que se comunican los cachalotes, pero creen que esta vía de investigación puede ser la clave para conocerlo algún día. “Estamos explorando cómo interpretar las unidades básicas de significado en su comunicación”, defiende Sharma. “Esencialmente, nuestro trabajo podría sentar las bases para descifrar cómo una 'civilización alienígena' podría comunicarse, proporcionando información sobre la creación de algoritmos o sistemas para comprender formas de comunicación completamente desconocidas”.
¿Un paso hacia el descifrado de sus mensajes?
Antonio José Osuna Mascaró, doctor en Biología y especialista en comportamiento animal, considera que el estudio es interesantísimo, aunque pide valorarlo en su contexto. “Es importante aclarar que aún sabemos poquísimo de la semántica asociada a la comunicación de cetáceos en general”, advierte. En su opinión, con la propuesta de este alfabeto fonético de los cachalotes, que sería en cierta forma similar a los fonemas que usamos los humanos para construir nuestro lenguaje, ahora sabemos que tienen el potencial de construir mensajes ricos en información, pero aún no sabemos realmente hasta dónde lo que se comunican aprovecha este potencial. “Esto es muy importante para la ciencia —concluye—, porque no sabemos casi nada de la semántica de la comunicación de los cetáceos en general, y si queremos enfrentarnos a este problema, y poder resolverlo algún día, necesitamos conocer qué son capaces de comunicar”.
Es obvio que esto abre la posibilidad de que los animales codifiquen información combinando elementos, pero equipararlo al lenguaje humano es extraordinariamente especulativo
En opinión de Javier Almunia, experto en bioacústica de cetáceos, si se confirma en posteriores estudios con otros clanes con codas diferentes, sería un avance significativo en el estudio de la comunicación de esta especie. “El resultado indica una nueva capa de detalle en la codificación de información mediante los codas que se conocían desde mediados de los años 60”, asegura. Si esas combinaciones codifican información, opina, ahora vendría un trabajo muy complicado que es analizar los distintos códigos y ver los efectos en el comportamiento de los animales, algo especialmente difícil, puesto que descienden a más de 2.000 metros de profundidad por periodos de más de una hora.
Desde su punto de vista, lo que es bastante más especulativo de este trabajo es esa comparación constante con el lenguaje humano que repiten varias veces durante el artículo. “Es obvio que esto abre la posibilidad de que los animales codifiquen información combinando los elementos que ellos describen asociados al ritmo y a la ornamentación de los codas”, asegura. “Pero equipararlo al lenguaje humano es extraordinariamente especulativo”.
En el mismo sentido se manifiesta Michel André, uno de los mayores expertos del mundo en bioacústica, que trabaja en la Universidad Politécnica de Cataluña (UPC) y cuyo trabajo sobre la comunicación de los cachalotes abrió el camino en el año 2000. “Lo que publicamos hace ya 20 años es que cuando se estudia el contenido de la información en los sonidos de esos cachalotes, los clics, uno se da cuenta de que son muy diferentes desde que se emiten hasta que se reciben, llegan hasta 15 km de distancia, que es el límite de comunicación con otros grupos”, recuerda. “Así que concluimos que la única constante que se mantenía, sin tener en cuenta la distancia y la profundidad, eran los intervalos de tiempo entre los sonidos y que era ahí donde podían estar los significados”. En otras palabras, si hay codificación de información debe estar en los ritmos, que es lo que no se perturba en la transmisión.
Sobre este nuevo resultado, lo considera muy interesante, aunque cree que es un error que traten de asemejar estos códigos a nuestro propio lenguaje. “Tenemos constancia de que hay comunicación oral, porque hay coordinación clara de los miembros de un grupo social”, asegura. “Pero intentar entender el mecanismo de comunicación de un animal cuyo cerebro lleva 30 millones de años evolucionando alrededor de la comunicación acústica a partir de la comparación con nuestra manera de producir sonidos y relacionarnos, probablemente sea caer en un antropomorfismo que nos alejará de la realidad”.
3