Así es Google Gemini, nuevo modelo de lenguaje de IA

La empresa detrás del buscador más famoso ha presentado Gemini, un nuevo modelo de lenguaje (LLM) que promete ser la base de la mejor inteligencia artificial lanzada hasta la fecha, más que la que utiliza OpenAI en su ChatGPT 4.

Este modelo ya se puede probar a través de Bard, el chatbot de Google, y en breve llegará a los al Google Pixel 8 Pro y otras herramientas de la casa. Pero hay que saber que se va a ir revelando e implementando en tres versiones diferentes, Nano, Pro y Ultra, que se corresponden a los tamaños de la información contenida en cada uno de los modelos.

En cualquier caso, según el propio CEO de Google se trata de “el modelo más avanzado y capaz que hemos creado hasta la fecha, que ha obtenido resultados excelentes en muchas de las cotas de referencia más utilizadas”.

¿Qué es Gemini de Google?

Lo primero que hay que dejar claro es que es un modelo de inteligencia artificial, no una herramienta en sí misma (por tanto no se puede descargar). Lo siguiente es que, según sus desarrolladores, este modelo de lenguaje ha sido creado desde el principio para ser multimodal.

Esto significa que puede trabajar (generalizar y entender, operar y combinar) con distintos tipos de información, tanto texto, como imágenes, vídeo, audio y código de programación. Gracias a esto, Gemini es capaz de comprender mejor la información matizada y responder a preguntas relacionadas con temas complicados.

En virtud de ello, desde Google sacan pecho y presumen del “modelo más flexible hasta la fecha, capaz de funcionar eficazmente en todas partes, desde en un centro de datos hasta en dispositivos móviles”

También de unas capacidades avanzadas “que mejorarán significativamente la forma en que los desarrolladores y las empresas crean aplicaciones con IA y les dan escala”. Igualmente, como hemos adelantado, presumen de ser más potente e inteligente que cualquier otro modelo similar al enfrentarse a todo tipo de tareas, desde la comprensión de imágenes naturales hasta el audio y vídeo, pasando por el razonamiento matemático.

Para demostrarlo, exhiben los resultados de una serie de test según los cuales Gemini habría superado “los resultados más avanzados en 30 de las 32 cotas académicas de uso generalizado, utilizadas en la investigación y el desarrollo de grandes modelos lingüísticos (LLM)”.

Incluso, el modelo más avanzado, Gemini Ultra habría superado —por vez primera y con un 90% de puntuación— a los expertos humanos en MMLU (comprensión masiva del lenguaje multitarea), que usa una combinación de 57 materias (física, matemáticas, medicina, historia, derecho, ética…) con las que se pone a prueba a las inteligencias artificiales tanto el conocimiento del mundo como la capacidad de resolución de problemas.

Además, aseguran que su nuevo enfoque de referencia para MMLU permite a sus algoritmos usar sus capacidades de razonamiento “para pensar más detenidamente antes de responder a preguntas difíciles, lo que se traduce en mejoras significativas con respecto a la primera impresión”.

¿Qué versiones de Gemini existen?

Como hemos adelantado, el nuevo modelo de lenguaje de Google, en su versión primigenia 1.0, se ha optimizado en tres tamaños diferentes:

Gemini Ultra es el modelo más potente y de mayor tamaño, diseñado para tareas de elevada complejidad.
Gemini Pro sería el modelo todoterreno, pensado para poder escalarlo en una gama amplia de propósitos.
Gemini Nano, sería el modelo de menor tamaño y potencia, desarrollado para resultar eficiente en la ejecución de tareas directamente en un dispositivo concreto.

¿Dónde se puede utilizar Gemini?

Como también hemos dicho, Gemini 1.0 se irá implantando en una serie de productos y plataformas y “llegará a miles de millones de personas” a través de los productos de la firma empezando por Bard, que ya incluye “una versión perfeccionada de Gemini Pro”, lo que le permitirá ofrecer “razonamientos más avanzados, planificación, comprensión y mucho más”. Se trataría, siempre según Google, de la mayor actualización de Bard desde su lanzamiento y claramente viene a plantar cara a la popularidad de ChatGPT.

Por su parte, el Pixel 8 Pro va a incorporar en breve Gemini Nano (la versión más light), lo que hará que ofrezca nuevas funciones “como Resumir en la Grabadora o utilizar la Respuesta inteligente de Gboard desde WhatsApp” (en 2024 llegará a otras apps de mensajería).

Además, el año próximo prometen incluir Gemini en otros productos y servicios como su popular buscador y aplicaciones como Ads, Chrome y Duet AI. Algo que según Google supondrá “un hito significativo en el desarrollo de la IA” y también “el comienzo de una nueva era para nosotros en Google”.

Imágenes | Fotos de Google y Rawpixel.com

Relacionado

Así es Gemini, el nuevo modelo de lenguaje de IA de Google

¿Qué es Gemini de Google?

¿Qué versiones de Gemini existen?

¿Dónde se puede utilizar Gemini?

Deja una respuesta Cancelar la respuesta