Google actualiza sus LLM a un ritmo increíble: ¡Gemini 1.5 ya está aquí!

5/5 - (2 votes)

Si el año 2023 estuvo marcado por el dominio de OpenAI, Google muestra una firme intención de ponerse al día en 2024. El gigante americano ha ido incrementando sus anuncios desde principios de año. Tras presentar hace unos días su modelo Ultra, la compañía presenta Gemini 1.5, una actualización de su modelo de lenguaje grande.

Un LLM con una nueva arquitectura.

La primera innovación que trajo Google para esta nueva versión de su modelo de lenguaje grande se refiere la técnica de aprendizaje utilizada para su formación. De hecho, Gemini 1.5 se basa en lo que se llama la mezcla de expertos o MoE.

Esta técnica de aprendizaje automático consiste en especializar ciertos elementos de una red neuronal artificial llamados expertos, en la ejecución de tareas específicas. Cada experto es capaz de manejar un tipo particular de datos como la clasificación de frases según parámetros definidos. La combinación de estos expertos dentro de la red neuronal permite para obtener una predicción más precisa. Entonces, basándose en los datos de entrada, el sistema selecciona y activa a los expertos más relevantes.

Gemini 1.5 Pro: una ventana emergente de registro

Al igual que Gemini 1.0, Google insinúa que Gemini 1.5 estará disponible en diferentes tamaños. Por ahora, la empresa presenta la versión Pro 1.5. La primera versión de Gemini, modelo 1.0, puede manejar hasta 32.000 tokens, Gemini 1.5 Pro dduplica este rendimiento alcanzando el millón de tokens, o aproximadamente 700.000 palabras. Esta hazaña técnica sitúa esta nueva versión LLM líder en el mercadomuy por delante de sus competidores como el GPT-4 Turbo de OpenAI, limitado a 128.000 tokens.

Esta ventana de texto más larga permite a Gemini 1.5 Pro procesar documentos largos y complejos, como artículos científicos o libros completos. Asimismo, esto le ofrece la posibilidad de tener conversaciones más largas.

Una nueva versión con rendimiento mejorado

Según Google, esta nueva versión de su LLM Gemini destaca por su capacidad de realizar razonamiento complejo en grandes volúmenes de datos. Para demostrar esto, los investigadores de DeepMind lo probaron enviando un tTranscripción de 402 páginas que relata la misión Apolo 11. Luego, le hicieron preguntas a las que Gemini 1.5 Pro supo responder pertinentemente.

Las pruebas comparativas también han demostrado su superioridad sobre el GPT-4 Turbo de OpenAI en varias tareas. En comparación con la versión anterior Gemini 1.0 Pro, el nuevo modelo Gemini 1.5 Pro muestra 28,9% más rendimiento en matemáticas, ciencias y razonamiento. Él también supera en un 5,2% en estos temas la versión Gemini 1.0 Ultra.

Sorprende el lanzamiento de Gemini 1.5 Pro, apenas una semana después del lanzamiento de 1.0 Ultra. Lanzamiento actualizaciones tan juntas, Google DeepMind podría intentar mantener su liderazgo sobre sus competidores, en particular OpenAI y su tan esperado GPT-5. Mientras esperan las próximas innovaciones de los gigantes tecnológicos, los desarrolladores ahora pueden explotar el poder de Gemini 1.5 Pro, a través de Vertex AI y AI Studio. Actualmente tienen una ventana emergente de 128.000 tokens traídos a pronto se expandirá a un millón. Debes saber que el chatbot Gemini (antes Bard) aún no se beneficia de esta nueva versión.

Nuestro blog está impulsado por lectores. Cuando compra a través de enlaces en nuestro sitio, podemos ganar una comisión de afiliado.