Más de 4.000 millones de personas usan internet cada día. ¿Cómo manejamos esa cantidad ingente de datos que hay en la web? Esta es la pregunta que se hace Ricardo Baeza-Yates, científico computacional, exdirector de investigación de Yahoo, es el actual director de tecnología de NTENT, una de las empresas de EE UU que lidera el desarrollo de búsqueda semántica inteligente. Baeza-Yates augura una explosión de datos con la irrupción del internet de las cosas que hará preciso introducir componentes éticos en el diseño de algoritmos.
algoritmos e internet de las cosas
El experto señala a SINC que “hoy, muchas personas van a la web a buscar información, pero son pocas las que la aportan. El porcentaje de gente activa en internet es muy pequeño, alrededor de un 5%. Sin embargo con el internet de las cosas todo estará conectado, ya que habrá cientos de sensores enviando señales. Será por lo menos dos órdenes de magnitud mayor de lo que tenemos, lo que supondrá un gran problema para filtrar los datos o procesarlos en tiempo real”.
Aquí jugará un papel decisivo el diseño de algoritmos para manejar esta cantidad ingente de información y, como siempre que se habla de algoritmos, emerge la cuestión de los sesgos. “Un tema que me preocupa es que la gente usa datos suponiendo que están completos y son fiables sin siquiera verlos, y muchas veces eso no es cierto. Si uno tiene conciencia del sesgo en la información, la puede analizar de forma correcta. Es importante que sepas en qué lado estás”, subraya.
Antes de la era de la posverdad, Baeza estudió durante mucho tiempo los sesgos que pueden afectar a la información, de todo tipo: geográficos (en países centralizados siempre hay más información de la capital que del resto del país), lingüísticos (la mitad de la información de la web está en inglés aunque la mitad del mundo no habla esta lengua) o de género (hay muchas menos biografías femeninas que masculinas en Wikipedia), educacionales o económicos.
libertad de elección…sobre lo que se ofrece
“Hay sesgos –añade- que son incluso más complicados, que tienen que ver con el mundo de las recomendaciones, similares a las que usa Amazon, porque la recomendación que hace el algoritmo afecta a tus decisiones futuras. Es decir, que vas a escoger una de las tres opciones que te doy a elegir y ninguna de las que no te presento”.
“Son los llamados sesgos algorítmicos, que, de manera similar a cuando hacemos predicciones, pueden llevarnos a una especie de autoegaño. Si no tienes cuidado el algoritmo puede sesgar tu opinión y a su vez esa opinión tuya afecta la opinión del algoritmo”, señala.
Es aquí donde surge el trabajo ético de los diseñadores de algoritmos, que han de tener en cuenta este efecto para hacer algo al respecto. ¿Tienen entonces ética los algoritmos, o, en su defecto, es importante que la tengan aquellos que los diseñan?
“Si la persona que escribe el algoritmo es consciente de sus sesgos lo puede hacer equitativo, introducir un equilibrio”, apunta. “Por supuesto, hay mucha carga ética de la que muchos programadores no son conscientes”.