Has elegido la edición de . Verás las noticias de esta portada en el módulo de ediciones locales de la home de elDiario.es.

Un algoritmo para entender lo que se dice en Twitter de un vistazo

El algoritmo de Sisu Labs permite analizar con lupa el contenido compartido en Twitter

Con más de 300 millones de usuarios activos al mes y 500 millones de tuits al día, tratar de analizar cómo se comporta la red social de los 140 caracteres en conjunto es imposible: atender a todos los tuiteros piando a la vez resulta, sencillamente, inviable.

Ni siquiera intentar poner el foco de atención en un tema concreto resulta sencillo. Ante un evento o un acontecimiento extraordinario, miles y miles de tuits se amontonan con un sinfín de reacciones. Sin embargo, algoritmos como el que ha creado Sisu Labs permiten analizar en tiempo real millones y millones de tuits para extraer su significado y entender las emociones que transmiten.

Sento, que es el nombre de la plataforma creada por esta compañía con sede en Barcelona, no es un conjunto de algoritmos que realizan cálculos numéricos, sino que tiene su fuerte en la comprensión lectora: a través de métodos de procesamiento del lenguaje natural, la herramienta va más allá de la simple monitorización de redes sociales introduciéndose en el mundo del ‘big data’ más lingüístico.

Ante acontecimientos inesperados y relevantes, es capaz de bucear por Twitter para resumir lo que se está diciendo sobre el tema en concreto y con qué connotaciones. Por ejemplo, distingue los mensajes que denotan una actitud positiva por parte del tuitero de los que reflejan una emoción negativa.

Además, Sento es capaz de extraer conceptos e ideas clave que se repiten a menudo en la conversación y de reconocer a los tuiteros más influyentes que han mostrado su opinión sobre el tema analizado (suelen ser, pero no exclusivamente, los que más retuits y favoritos reciben).

Con toda esta información, hacerse una idea general del sentir tuitero en un debate, casi en tiempo real, es posible gracias al procesamiento del lenguaje natural. Un arma más en la lucha de internet contra el ruido y la avalancha informativa.

Etiquetas
stats