¿Es posible realizar un análisis de emociones en Twitter o saber el estado anímico de una persona en el momento en que escribió un tuit? Sin duda, un lector humano es capaz de detectar las sutilezas en el lenguaje que aportan pistas sobre el tono y la intención del tuitero. Pero a las máquinas se les da bastante mal evaluar estados anímicos tras textos tan ‘crípticos’ (para ellas) como “Pues buenos lunes a todos, ¿no? ?”
Desde hace años, analistas científicos de todo tipo bucean en las interacciones de Twitter en busca de patrones que ayuden a entender a las personas (sociología), pronosticar resultados electorales (política) e incluso comprender mejor nuestros sesgos (filosofía de la ciencia). Sin embargo, los apasionantes conflictos de esta red de microblogging son tan complejos como el lenguaje.
Análisis de emociones en Twitter: es viable, aunque complicado
Analizar el sentido de un tuit es una de las barreras más complejas a la hora de analizar el pulso de las redes sociales y, por tanto, el estado de una parte relevante de la sociedad. Hasta ahora, los análisis tienden a buscar palabras puntuales, pero esto puede perder el sentido original del tuit. No es lo mismo “Vamos a casa” que “A casa, vamos”. El análisis ha de ser más profundo.
Estudiar la comunicación humana escrita no es tarea fácil. Como se ha visto en el ejemplo que abre este artículo, una misma oración puede cambiar de significado según el lector, siendo extraordinariamente complicado asignar un estado de ánimo (mood) o una intención tras la redacción. En muchas ocasiones ni siquiera los lectores humanos son capaces de adivinar la intención del emisor del mensaje, lo que en Twitter se traduce como conflicto garantizado.
Para poder analizar mejor el pulso de esta red social, en septiembre de 2020 se publicó el artículo científico ‘Reconocimiento mejorado de emociones en las redes sociales españolas mediante la incorporación de conocimiento léxico’ en ‘Sciencedirect’ por parte del equipo formado por Miriam Plaza-del-Arcoa, M. Teresa Martín-Valdivia y L. Alfonso Ureña-Lópeza, del departamento de Ciencias de la Computación de la Universidad de Jaén; y Ruslan Mitkovb, de la Universidad de Wolverhampton (Reino Unido).
En este artículo analizan cómo se utilizan “diferentes enfoques de aprendizaje automático para reconocer automáticamente las emisiones en mensajes escritos en español en las redes sociales”. Y es que estos análisis hacen uso de diferentes puntos de partida y algoritmos para tratar de acercar —con mayor o menor acierto— cuál ha sido el estado de ánimo al escribir un tuit.
Entre las conclusiones se puede leer cómo el análisis del español por estas técnicas sigue avanzando tras el inglés, así como la necesidad de seguir investigando en los sistemas que más éxito tienen a la hora de detectar emociones. Pero, ¿para qué puede servir conocer el estado anímico, las emociones o la intención con la que fue escrito un tuit?
¿Puede Twitter predecir elecciones?
En 2018, durante una entrevista a Marc Argemí con motivo de la publicación de ‘El sentido del rumor’, confirmó cómo desde Sibilare tratan de desarrollar una metodología que “intentaba traducir en estimación de voto el tono y el volumen de la conversación en redes”. Lo cual no es sencillo.
En esencia, se trataba de descubrir si un volumen importante de tuits en determinada dirección política se traducía después en una mejor aproximación a las encuestas de intención de voto a pie de urna. Y lo cierto es que sí. En artículos como ‘Minería de datos no supervisada en Twitter’ (2018), de J. Ángel Díaz-García, María J. Martin-Bautista y Mª Dolores Ruíz, demostraban cómo una buena metodología de análisis de redes sociales ayudaban a entender el mundo.
Estas metodologías no son nuevas, aunque ya son más fieles a la realidad futura que las clásicas encuestas (en las que los entrevistados pueden elegir mentir o mentir por otros motivos). Desde hace unos años ha habido mucho interés en entender cómo contribuyeron las redes sociales al éxito del Brexit o a la subida al gobierno de Donald Trump.
Y en muchos análisis se confirma que fueron herramientas indispensables para transmitir ideas. Una de las ventajas de analizar comportamientos en lugar de realizar encuestas, dice Stephens-Davidowitz en ‘Everybody lies’ (2017), es precisamente que no se puede mentir en lo que se hace. Se realiza, queda registrado y puede analizarse a posteriori mediante machine learning u otras técnicas como GLTR (usada en principio para detectar textos de GPT-2).
Detectar textos que contienen mentiras ya es posible
Para el ejemplo anterior, véase a una persona que escribe en Twitter:
“Hoy, quinto día seguido de ir al gimnasio #motivación #esfuerzo ?”
Desde la perspectiva del lector humano, el mensaje está claro. Y, gracias a la etiqueta, los sistemas de reconocimiento del lenguaje natural también pueden asociar el texto a una motivación positiva por defecto. Sin embargo, el texto presenta problemas de análisis más allá de la ironía: lo escrito puede ser mentira, incluso sin una mala intención detrás. Por ejemplo, una broma.
Dicho esto, un análisis a fondo del GPS del teléfono demuestra que tras la publicación de aquel tuit, el usuario en cuestión pasa tres horas seguidas haciendo scroll a Twitter desde el sofá de su casa; haciendo, además, fotografías a una tarrina de helado de chocolate que se sube directamente a Google Fotos (que, por cierto, las identifica muy bien aunque vayan sin etiquetas).
Una vez contemplada esta posibilidad, ¿hay forma de establecer el ánimo de un tuit sin recurrir a datos ‘externos’ al propio mensaje como pueda ser el GPS o las fotografías realizadas en el teléfono? Desde una perspectiva probabilística basada en macrodatos, lo cierto es que sí.
En España, la policía ya hace uso de un sistema basado en inteligencia artificial para analizar denuncias de hurto llamado VeriPol. Esta herramienta analiza el texto escrito en la denuncia y le da una ‘nota’ (probabilística) para determinar cómo de viable es que el suceso haya ocurrido o que haya ocurrido tal y como dice el denunciante. Y esto mismo puede aplicarse a Twitter y al análisis de tendencias.
La probabilidad de acertar el estado de ánimo con el que se escribió un enorme conjunto de tuits es mayor que el análisis de los subconjuntos más pequeños. Dicho de otra forma, el error disminuye a medida que se integran más y más datos al sistema de análisis y se refina la herramienta de machine learning.
¿Análisis de emociones en Twitter para predecir el futuro?
El uso de Twitter para adelantar la intención de voto no es nuevo, y, sin duda, se beneficiará del análisis de las emociones tuiteras. Ya en febrero de 2016 el periodista Daniel White confirmaba que Twitter había sido el mejor indicador de la victoria de Trump en Iowa (Estados Unidos) contra Ted Cruz. Pero estas herramientas pueden afinarse aún más, incluyendo elementos como el ánimo al escribir.
Hace tiempo que se sabe que las ideas (políticas, sociales, económicas) que triunfan no son especialmente las que tienen más apoyos, sino las que tienen menos detractores. Es el motivo por lo que los políticos rara vez sacan un aprobado en sus valoraciones o que explican el interés tras las fake news que difaman ideas contrarias.
Twitter es una herramienta de microblogging muy dada a la polarización política, al sensacionalismo y a los intercambios intensos de opiniones, por lo que resulta perfecta para tomar el pulso a las masas allí donde intercambian ideas al analizar las emociones. Herramientas como las analizadas por los investigadores de la Universidad de Jaén pueden ayudar a realizar este tipo de evaluaciones.
En Nobbot | ¿Puede deprimirse una inteligencia artificial?
Imágenes | iStock/Prostock-Studio, iStock/olya_steckel, iStock/ViewApart