‘Dime qué coche tienes y te diré cómo eres’ dice el refrán, y los investigadores de la Universidad de Stanford han llevado esa máxima a un nuevo nivel. A través de algoritmos informáticos que pueden ver y aprender, han analizado millones de imágenes disponibles públicamente en Google Street View. Estos profesionales consideran que pueden usar estos algoritmos para determinar las tendencias políticas de un vecindario observando únicamente los coches que hay aparcados en las calles.
«Al utilizar datos visuales fáciles de obtener, podemos aprender mucho sobre nuestros barrios y complementar cierta información que requiere inversiones de miles de millones de dólares a través de encuestas censales’’, ha explicado Fei-Fei Li, profesor asociado de ciencias de la computación en la Universidad Stanford y director del Laboratorio de Inteligencia Artificial en el que se está llevando a cabo este proyecto.
No obstante, estos investigadores consideran que gracias al estudio continuo de nuestra sociedad, utilizando datos visuales baratos y disponibles, pueden obtener información con más posibilidades. Además, los responsables del estudio son expertos en visión artificial y aprendizaje profundo, un tipo de inteligencia artificial en el que las computadoras se enseñan a reconocer y a transformar objetos tridimensionales en imágenes bidimensionales.
A través de esta técnica, desarrollaron algoritmos entrenados para reconocer la marca, el modelo y el año de cada automóvil producido desde 1990 en cada una de más de 50 millones de imágenes de Google Street View de 200 ciudades estadounidenses.
google street view, coches y encuestas electorales
Los datos sobre tipos de automóviles y ubicación se compararon con la base de datos demográfica más completa en uso, la Encuesta de la Comunidad Estadounidense, y, a su vez, con los datos de las elecciones presidenciales para estimar el voto según factores demográficos como raza, educación o ingresos.
El coordinador de este proyecto y su equipo han comprobado que existe una relación lineal simple entre los automóviles, dichos datos demográficos y la persuasión política. Según cuentan los impulsores del estudio en la web de la propia universidad, se trata de relaciones simples, pero poderosas. Por ejemplo, si el número de turismos en un vecindario es mayor que el número de camionetas, hay un 88 por ciento de posibilidades de que el distrito electoral vote al Partido Demócrata. Y viceversa, en caso de que haya más camionetas que turismos, habrá un 82% de posibilidades de que un distrito vote a los republicanos.
estudios más precisos y continuos
Más allá de las repercusiones políticas obvias, los investigadores creen que sus algoritmos podrían ayudar a que las encuestas demoscópicas actuales sean más precisas y continuas. Por ejemplo, la Encuesta sobre la Comunidad Estadounidense se lleva a cabo a través de un trabajo puerta a puerta laborioso y con un coste elevado. Además, se trata de estudios que se demora hasta dos años debido a que primero hay que recopilar todos los datos y analizarlos después para publicarlos.
Pero gracias a este proyecto que utiliza una base de datos de imágenes actualizada, disponible gracias a Google Street View, se puede generar un análisis casi en tiempo real. No obstante, los responsables de este estudio no consideran que sus algoritmos puedan reemplazar a las actuales encuestas demoscópicas, sino que sirvan de complemento para mantener una actualización continua de datos.
los detalles sí importan
Esta iniciativa comenzó con una base de datos de 15.000 automóviles proporcionada por la web de venta de automóviles Edmunds.com, pero eso fue solo el principio. Después, los investigadores tuvieron que categorizar los coches incluyendo los detalles más sutiles, uno por uno. Por ejemplo, la diferencia entre el Honda Accord 2007 y 2008, es un cambio casi imperceptible en las luces traseras traseras. Gracias a esta precisión en la fase de estudio, el algoritmo funcionó rápidamente y ordenó 50 millones de imágenes según 2.657 categorías basadas en la marca, modelo y año en tan solo dos semanas.