En el vídeo de abajo, publicado en marzo de 2019, se observa a dos investigadores de Nvidia. Varios equipos de trabajo de esta marca han logrado generar imágenes fotorrealistas derivadas de garabatos al estilo Paint.
Es decir, uno ‘pinta’ un borrón verde que ocupa la mitad de la pantalla, le dice a una inteligencia artificial que son árboles y, como resultado, se compone una fotografía que parece de verdad con una colina boscosa. Un trazo vertical, marcamos “agua” y aparece una cascada. Merece la pena verlo para comprobar lo que la IA puede hacer.
Cualquiera podrá generar la fotografía que busca
A menudo usamos en Nobbot fotografías de un banco de imágenes. Arriba vemos un montaje. A la izquierda, lo que necesita la inteligencia artificial (IA) de Nvidia. A la derecha, una posibilidad futura. La interpretación de un borrón. Un borrón y aparece una montaña. Otro y se dibuja un lago. Un borrón más y aparece el cielo con nubes.
Nvidia nos dice que las fotografías de paisajes ni siquiera necesitarán de un fotógrafo o de un emplazamiento físico que capturar. Llevemos esta tecnología un poco más allá. Dentro de unos años quizá ni siquiera tengamos que dibujar nada.
Simplemente podríamos abrir un software y escribir “un paisaje de playa con el sol en el horizonte, atardecer”. Segundos más tarde podríamos tener la composición tal y como ya hemos visto que ocurre con las recetas de comida. Para lograr su software actual, Nvidia ha recurrido a una enorme base de datos con imágenes de paisajes.
A las personas nos hace falta un solo ejemplo de una playa para identificar la siguiente, pero no podemos componer en segundos la fotografía de una. Por contra, a la IA le hacen falta millones de imágenes de playas, pero basta pedirle una para que aparezca al instante en la pantalla. Esto ocurre gracias a las redes generativas adversarias.
Por qué todos hablan de las redes generativas adversarias
El cerebro humano no es una máquina que albergue un solo ‘yo’. Sabemos que nuestro comportamiento cambia a lo largo del día. También que dentro de nuestro cerebro hay una pugna constante por el control de nuestros actos. Somos dividuos, y eso nos confiere más oportunidades de supervivencia al guardar dentro de nosotros mismos ciertos antagonismos.
Eso es precisamente lo que externalizan las redes generativas adversarias o GANs: una forma de hacer que dos o más inteligencias artificiales trabajen juntas (en oposición) para que el resultado de su trabajo dé lugar a algo más grande de lo que podría haber realizado por separado. Trasladar un cuadro al estilo de pintura de otro, o un rasgo facial a otra cara.
El trabajo de arriba también es de Nvidia (2014 y 2018). Muestra una inteligencia artificial usando una fuente (source) y trata de acercarla a un destino (destination). Así tenemos un número ilimitado de rostros falsos. Lo que no vemos es que para que el sistema tenga éxito hay, frente a la IA que compone rostros, otra IA que pretende desacreditarla.
Se habla cada vez más de GANs porque el aprendizaje que consiguen dos máquinas enfrentadas converge rápidamente en conocimiento y puede superar con creces muchos estándares humanos. Y esto nos sirve para una gran cantidad de tareas como generar fake news o novelas a medida.
GPT-2 y GLTR: ataques y contraataques
Nvidia ha logrado que una inteligencia artificial aprenda a crear rostros, casas, coches, paisajes y un largo etcétera de imágenes fotorrealistas. Y además lo ha empaquetado de forma que usarlo parece tremendamente fácil. Lo mismo hicieron en Open AI con GPT-2, un modelo de lenguaje capaz de continuar una frase y redactar un artículo periodístico derivado de ella. Falso, claro.
Meses más tarde aparecía GLTR, un adversario capaz de detectar los textos ‘escritos’ mediante GPT-2. Esta confrontación recuerda a la carrera armamentística o a un darwinismo acelerado.
Dos inteligencias artificiales, una encargada de escribir una novela y otra tratando de descubrir qué novela de un conjunto ha sido escrita por la primera, podrían dar al traste con la escritura (humana). Ya hay inteligencias artificiales que componen arte o que revisan texto.
Estamos a un paso de diseñar tecnología que hará tambalearse más de un modelo de negocio. Por ejemplo, los fotógrafos que capturan paisajes o redactores como un servidor. Los robots que “nos quitan el trabajo” no tienen por qué tener manos.
En Nobbot | “Esta persona no existe” pero la inteligencia artificial hace que lo parezca
Imágenes | iStock/Phaelnogueira, NVIDIA