La tecnología y el universo online están constantemente reinventándose. El terremoto digital se revoluciona a sí mismo varias veces al año. Sin embargo, las raíces de este mundo online e hiper-comunicado están en el pasado; y una serie de ideas recurrentes se repiten desde entonces. La web semántica es una de ellas. Así es como está ayudando a la inteligencia artificial y a los sistemas de control por voz.
El lenguaje, lo más natural posible
“La voz es natural, es nuestra forma de comunicarnos. La llevamos utilizando durante cientos de miles de años. Y ahora la estamos usando para cambiar la forma con la que intercambiamos información con las máquinas”.
Para Max Amordeluso, lead evangelist de Amazon, el futuro de la conversación con las máquinas pasa por conversar con ellas igual que lo hacemos con el resto de seres humanos. Es cierto que el producto más revolucionario de Amazon, Alexa, combina voz e inteligencia artificial para intentar (re) evolucionar la forma en que conversamos con nuestros dispositivos. Pero eso no le resta importancia a la afirmación de Amordeluso.
“El gran problema – continúa el ejecutivo de Amazon en una charla durante el 4YFN 2018 en Barcelona – es que a las máquinas no se les da bien la desambiguación”. Desde pequeños, los seres humanos (hispanohablantes) aprendemos que, si nuestros padres nos piden que compremos una barra, probablemente no se refieran a la del bar. O si nos dicen que le demos de comer al gato, lo más seguro es que no quieran que busquemos nada en el garaje (ni alimentemos a un madrileño). Usamos el contexto para concretar el significado de las palabras y no nos cuesta apenas esfuerzo.
Para las máquinas, sin embargo, es una tarea complicada. Si los sistemas de reconocimiento por voz tienen que aprender a comprender el llamado lenguaje natural, y, de hecho, ya lo están haciendo, necesitan procesar mucha más información que el significado de la palabra en el diccionario. Aquí es donde una ambiciosa idea caída en desuso está echándoles un cable a desarrolladores y programadores.
La web 3.0 que nunca llegó (o sí)
Corría el año 2001 cuando el padre de Internet, Tim Berners-Lee, junto a James Hendler y Ora Lassilla, bautizaba en la revista Scientific American la web semántica. Le ponía nombre así a una idea que llevaba años rondando por el mundo informático, tan antigua como las primeras propuestas de hipertextos desarrolladas en los años 40 del siglo XX, durante la segunda Guerra Mundial.
Google o Facebook apuestan por las bases de datos semánticas para mejorar sus productos; y Cortana, Siri o Alexa han asumido los principios de la web semántica para aprender el lenguaje humano
La web semántica, también conocida como web 3.0, reúne una serie de tecnologías para publicar datos legibles por aplicaciones informáticas, por máquinas. Estos datos incluyen datos semánticos y ontológicos que describen el contexto, el contenido y la relación entre los propios datos. El problema principal de esta idea es que, hoy por hoy, es imposible adaptar todo el contenido de Internet para que sea semántico. Además, el volumen de datos que se genera por cada documento online se dispara.
Así, la web semántica no terminó de ser todo lo disruptiva que se pretendía. Su nombre se perdió en las nieblas de la revolución digital. Y, sin embargo, las tecnologías semánticas están a la orden del día en los principales buscadores como Google, Bing o Baidu, las redes sociales, los sistemas de inteligencia artificial y análisis de datos como Watson (IBM) o, como hemos visto, las plataformas de control por voz, como Alexa, Cortana (Microsoft) o Siri (Apple).
El renacimiento de la web semántica
“Las buenas noticias son que hoy existen evidencias de que la web semántica está emergiendo de forma acelerada. Lejos de la idea ambiciosa de un principio, pero a través de pequeñas versiones de sí misma y de los asistentes inteligentes”, explica Peter Sweeney, fundador de la compañía de inteligencia artificial Primal, en un artículo publicado en Medium.
La clave está en la necesidad de que las máquinas entiendan el lenguaje natural. Es decir, que entiendan nuestras órdenes, aunque estén llenas de ambigüedades y estructuras coloquiales. Para ello es esencial el concepto de linked data o datos enlazados, una evolución más asequible de la web semántica. Esta tecnología se centra en crear bases de datos abiertas, distribuidas y descentralizadas interconectadas entre sí.
“Los datos enlazados abren la puerta a que las máquinas combinen información de formas muy complejas”, continúa Sweeney. A más información compleja, más contexto, más matices y mejor comprensión. Y así es como una idea caída en desuso ha impregnado la revolución de la inteligencia artificial y ha reforzado nuestra comunicación con las máquinas, ayudando a que estas entiendan, cada vez mejor, nuestro lenguaje imperfecto y ambiguo.
Hablando con la cafetera
Más y más personas conectadas y conversando a través de Internet y miles de millones de objetos haciendo lo mismo. Este es el presente de la red. En el futuro cercano, los números parece que no van a dejar de crecer. En este mundo de cantidades inimaginables de datos, la inteligencia artificial se hará cada vez más inteligente. Cuanta más información reciban las máquinas y sus algoritmos, más eficientes se volverán.
La web semántica o, mejor, las tecnologías derivadas de este concepto y las bases de datos enlazados ganarán fuerza. El volumen de linked data no ha dejado de aumentar en los últimos años: gigantes como Google o Facebook apuestan por las bases de datos semánticas para mejorar sus productos; y los asistentes inteligentes como Cortana, Siri, Google Now o Alexa han asumido los principios de la web semántica para aprender el lenguaje humano.
Además, parece que no hay vuelta a atrás. “Pensemos una cosa. Hoy por hoy, tenemos ya una generación completa de gente joven que está haciéndose mayor asumiendo que siempre van a poder hablar con sus dispositivos, hablar con su casa”, reflexiona Max Amoderluso, de Amazon. Quién sabe si llegará un día en que quien mejor nos sepa escuchar sea nuestra cafetera. ¿Nos acordaremos entonces de la web semántica?
En Nobbot | Por qué 2017 será el año de los asistentes virtuales personales
Imágenes | iStock, Pixabay, Wikimedia Commons