La empresa tecnológica china ShengShu-AI y la Universidad de Tsinghua han creado Vidu, un nuevo modelo de inteligencia artificial (IA) para generar vídeos a partir de texto.
Según sus desarrolladores, las capacidades de Vidu se encuentran a la par de las de
Recordemos que la herramienta creada por OpenAI permite crear videos de hasta 60 segundos con escenas muy detalladas, un movimiento de cámara complejo y múltiples personajes a partir de un texto. Y es aquí donde encontramos la primera diferencia entre los dos generadores de vídeo porque Vidu solo permite crear piezas de 16 segundos.
Como Sora, Vidu puede simular el mundo físico real y generar escenas de alta definición con detalles complejos que son compatibles con la física del mundo real, como efectos creíbles de luz y sombra y expresiones faciales detalladas. También puede generar tomas dinámicas complejas, en lugar de fijas. El resultado es un vídeo con una resolución máxima de 1080p.
vidu sigue los pasos de sora
Este modelo chino para crear vídeos a partir de texto se produjo casi dos meses después de que Sora, desarrollado por OpenAI, cuya puesta de largo causó sensación en todo el mundo. «Después del lanzamiento de Sora, descubrimos que se alineaba estrechamente con nuestra hoja de ruta técnica, lo que nos motivó aún más a avanzar en nuestra investigación con determinación», dijo Zhu Jun, vicedecano del Instituto de Inteligencia Artificial de la Universidad de Tsinghua y científico jefe de ShengShu-AI.
De momento resulta difícil comparar las capacidades de Sora y Vidu porque estas herramientas de inteligencia artificial no están disponibles para el público general. Lo que queda claro es que ahonda en la sensación agridulce que causan los avances constantes en inteligencia artificial generativa. El fiel de la balanza se mueve entre la oportunidades creativas y productivas que ofrecen junto a las perspectivas de reducción de empleo en múltiples sectores.