Varios investigadores de la Universidad de Tel Aviv (Israel) han programado una inteligencia artificial (IA) para que aprenda qué relación hay entre el texto de una receta y el resultado final del plato. Gracias a eso, han conseguido usar esta IA para hacer lo contrario: darle un texto y que «dibuje» la comida resultante. Pero vayamos por partes. ¿Qué estamos viendo en las imágenes de arriba?
En la primera fila observamos fotografías de platos reales resultado de una receta. En la segunda y tercera, varios intentos por parte de la IA de componerla visualmente usando su texto (sin el título de la receta). Observamos que en algunos casos la composición se acerca notablemente. ¿Cuántas personas podrían pintar en segundos algo así?
¿Cómo se imagina un plato cocinado una ia usando recetas?
“Crear una imagen que refleje el contenido de un texto largo es un proceso complejo que requiere cierto sentido de creatividad”. Así es como abre ‘GILT: Generating Images from Long Text’ (2019). Este estudio profundiza en la complejidad de dar a las máquinas el sentido de la composición.
Ori Bar El, Ori Licht y Netanel Yosephian continúan poniendo ejemplos. La portada de un libro en base al texto, el póster de una película según su guion o la imagen de un plato preparado basado en su receta. Es en este punto en el que los investigadores han querido aportar su granito de arena al conocimiento.
El resultado es el que podemos observar arriba. La imagen muestra cómo puede ‘imaginar’ diferentes recetas. La diferencia entre la segunda y tercera fila responde a diferentes formas de entender los textos, con y sin lo que los responsables del estudio llaman “regularización semántica”. Esta diferencia es importante.
Nos trae a primer plano cómo con un mismo conjunto de datos la respuesta de la inteligencia artificial difiere. Para entenderlo, es como si se usaran dos traductores diferentes. Según los investigadores, el uso de la regularización semántica aporta un nivel extra de clasificación. Algo relevante cuando hablamos del aprendizaje de las máquinas.
Así aprende recetas una máquina
Muchos lectores pueden preguntarse mediante qué mecanismo es capaz una IA de saber cómo lucen unos macarrones con tomate. Es el mismo por el que aprenden a identificar gatitos en internet. Lo primero que se hace es generar un código que sepa establecer las características primarias tanto de una receta como de la imagen de la comida preparada, así como sus posibles relaciones.
Es decir, que enlaza la imagen del objeto (significado) con el texto que lo identifica (significante). Cuando hablamos de textos largos, significante no es tan simple como “macarrón” o “pescado”. Por tanto, entra en juego un análisis mucho más complejo. Entra en juego, en concreto, Recipe2ImageGAN, el código que ha sido liberado en GiHub para que otros investigadores puedan usarlo.
La parte complicada viene a continuación. Retirando el título de la receta (para aumentar la dificultad) se introduce en diferentes espacios del algoritmo dos bases de datos. Por un lado, recetas. Por otro, imágenes. Para el experimento en cuestión se han introducido 800.000 pares. Mucho, pero las máquinas no tienen nuestra forma de aprender.
Si a un niño le enseñas una lechuga, sabrá identificarla siempre aunque pertenezca a otra variedad. Incluso podría, según la destreza, pintar el resultado de una receta. Una inteligencia artificial requiere de miles si no millones de ejemplos. A favor está que el resultado final es más visual.
¿Qué utilidad podría tener que una IA sepa cómo será una comida?
Cualquier restaurante tardaría poco tiempo en preparar un plato para fotografiarlo. De modo que, a priori, no parece algo particularmente útil. Sin embargo, los resultados son muy interesantes. Este equipo ha logrado una precisión enorme en la generación de imágenes, algo extremadamente complejo.
Incluso aunque la única utilidad directa de esta IA haya sido ayudar al desarrollo de la inteligencia artificial, el experimento ha merecido la pena. Todos estos estudios nos acercan a un uso más humano de la tecnología.
Por ejemplo, este tipo de adelantos pueden ser muy útiles a la hora de generar nuevos pictogramas que ayuden a personas con autismo. En lugar de generar una imagen en alta calidad y realista, un tipo de IA similar podría sintetizar en un pictograma accesible un gran conjunto de normas complejas.
También puede usarse por parte de profesionales creativos a la hora de generar portadas de libros o cartelería. Otro ejemplo. Una inteligencia artificial puede darnos las claves de cómo sintetizar una novela orientada al público adulto a un territorio juvenil. Incluso hacer mejores sinopsis, transformando texto a texto.
Lo cierto es que las posibilidades de sistemas similares son amplias. Imaginemos reconstruir la imagen de una especie extinta de la que no haya documentos gráficos usando las descripciones escritas de su comportamiento, características o presencia en la vida de las personas.
En Nobbot | Quick, Draw!, el algoritmo que sabe lo que estás dibujando
Imágenes | Ori Bar El, Ori Licht, Netanel Yosephian