Diego Serrano Venturini, científico de datos de Orange
R es un software libre con más de 60 años de historia. Pese a ser un lenguaje tradicionalmente empleado por matemáticos y, sobre todo, estadísticos en el ámbito académico, su crecimiento en los últimos 5 años ha sido notable. El florecimiento de los cursos online en plataformas como Coursera, Udacity, EDX y el apoyo de grandes universidades americanas y empresas spin-off surgidas bajo su paraguas como RStudio, son las causas principales para la extensión de este lenguaje en el mundo de la ciencia de datos.
En España, la comunidad de usuarios de R es mucho más joven, pero ya cuenta con foros estables que permiten compartir conocimientos y experiencias para mejorar la habilidades de los programadores. Precisamente, los días 16 y 17 de noviembre se celebra en Granada la novena reunión de usuarios de R para compartir proyectos realizados en este ecosistema.
Allí se revisarán trabajos sobre cuestiones tan diversas como análisis de opiniones en monumentos culturales con R, estudio de eventos en partidos de fútbol, resiliencia de pinares repoblados frente al cambio climático o análisis sobre sesgos de género.
Y es que R es hoy uno de los lenguajes más utilizados en investigación por la comunidad estadística, siendo además muy popular en el campo de la minería de datos, la investigación biomédica, la bioinformática y las matemáticas financieras. A esto contribuye la posibilidad de cargar diferentes bibliotecas o paquetes con funcionalidades de cálculo y gráficas.
software libre y orange
Las posibilidades que ofrece este lenguaje son muy numerosas y de todas ellas se hablará en la jornada de Granada. Entre los ponentes figura Diego Serrano Venturini, científico de datos de Orange, con el que hemos hablado para que nos explique cómo aplica R en su día a día en Orange, en concreto en la mejora de la atención al cliente de esta operadora.
“Dentro del cambio cultural que estamos llevando a cabo, uno de los pilares fundamentales es el foco en el cliente y, en este contexto, R se erige como una herramienta fundamental”, señala.
“Las metodologías ágiles, la infraestructura Big Data y las posibilidades que ofrece el software libre, en concreto R, hacen posible la confluencia de fuentes tan dispares como las redes sociales, las interacciones de los clientes en call-center, los datos de facturación o la calidad de red o televisión”, explica.
campañas de fidelización con R
¿Pero todas estas posibilidades cómo se traducen en desarrollos concretos? Según Diego Serrano Venturini, “con todas estas fuentes se infiere una satisfacción de todos los clientes que permite realizar campañas de fidelización o de conversión de clientes insatisfechos a satisfechos”.
“De esta forma –dice Serrano Venturini- se identifican oportunidades de digitalización o puntos de mejora; o se construye un diccionario de sentimientos en base a las encuestas de los clientes y sus comentarios.
Un diccionario de sentimientos es una aplicación de la minería de textos que permite identificar (y cuantificar) la emoción asociada a cada palabra dentro de un contexto. Dentro del análisis de la satisfacción del cliente permite clasificar un comentario como ‘negativo’, ‘positivo’ o ‘neutro’; o identificar aquellas palabras que representan un alto nivel de hastío, fidelidad, enfado o probabilidad de fuga.
R es parte del sistema GNU y se distribuye bajo la licencia GNU GPL. Está disponible para los sistemas operativos Windows, Macintosh, Unix y GNU/Linux.