Gemini, lo nuevo de Google para revolucionar la Inteligencia Artificial

Este modelo de Inteligencia Artificial multimodal tiene la capacidad de generar, comprender, operar y combinar diferentes tipos de información

Google presentó la semana pasada su última hazaña en el campo de la Inteligencia Artificial: Gemini. Este hito marca el resultado de una colaboración a gran escala entre diversos equipos de Google, incluyendo a Google DeepMind y Google Research, y representa el proyecto científico e investigativo más ambicioso de la empresa hasta la fecha.

Optimizado en tres dimensiones distintas, Gemini 1.0 se presenta en tres versiones clave:

  • Gemini Ultra: El modelo de mayor capacidad y tamaño diseñado para abordar tareas complejas.
  • Gemini Pro: Considerado el mejor modelo para escalar una amplia gama de tareas.
  • Gemini Nano: Destacado por su eficiencia en dispositivos móviles.

¿Qué hace único a Gemini? Este modelo de Inteligencia Artificial multimodal tiene la capacidad de generar, comprender, operar y combinar diferentes tipos de información, desde texto e imágenes hasta audios, videos y lenguajes de programación. Además, es flexible y puede ejecutarse en una amplia variedad de dispositivos, desde móviles hasta centros de datos, lo que promete una transformación en la manera en que las empresas y desarrolladores utilizan la IA.



En un esfuerzo por superar las limitaciones de los modelos multimodales convencionales, Google ha diseñado Gemini para ser un modelo de IA multimodal nativo, entrenado previamente en múltiples modalidades desde su inicio. Esto permite a Gemini comprender y razonar con diferentes tipos de datos desde el principio. Gemini ha sido sometido a rigurosas pruebas de rendimiento en una variedad de tareas, desde comprender imágenes, audio y video hasta el razonamiento matemático.

La disponibilidad de Gemini 1.0 se extenderá a una serie de productos y plataformas. Para los usuarios, Bard con Gemini Pro estará disponible en inglés en más de 170 países y territorios, mientras que Pixel 8 Pro será el primer teléfono inteligente diseñado para ejecutar Gemini Nano, introduciendo nuevas funciones como resúmenes en la aplicación de Grabadora e implementando Redacción Inteligente en Gboard.

Para desarrolladores y clientes, Gemini Pro estará disponible a través de la API de Gemini en Google AI Studio y en Vertex AI a partir del 13 de diciembre. Estas herramientas permitirán una personalización avanzada de Gemini con control total sobre los datos, aprovechando la seguridad y privacidad de Google Cloud.

Mirando hacia el futuro, la versión Ultra de Gemini se encuentra actualmente en pruebas de seguridad con socios externos y se abrirá a un grupo selecto de usuarios y desarrolladores para experimentación temprana a principios del próximo año.