A pesar de haber llegado después de ChatGPT, Gemini de Google parece estar acelerando su evolución. Esta IA del gigante de la investigación quiere dominar el mercado y garantizar a todos el acceso a esta inteligencia artificial cada vez más presente. Así, Google acaba de anunciar Gemini 1.5, que incluso libros enteros pueden interpretar.
Apenas una semana después de anunciar la llegada del chatbot Gemini para reemplazar a Bard, Google reveló novedades. Anunció la llegada de la nueva generación de su modelo de inteligencia artificial, Gemini 1.5, que a partir de ahora ya está disponible para algunos usuarios.
Se trata de una actualización del modelo, que según la propia empresa, utiliza un nuevo enfoque "Expert Mix". Su objetivo es mejorar la eficiencia dirigiendo las solicitudes realizadas por los usuarios a un subconjunto de redes neuronales "especializadas" más pequeñas capaces de ofrecer servicios más rápidos y respuestas de mayor calidad.
Una de sus principales novedades es el aumento del número de tokens que el modelo puede procesar. Hasta ahora, el límite era de 200.000 tokens, pero la ventana de contexto se ha ampliado hasta alcanzar la mayor vista hasta ahora en cualquier modelo fundamental a gran escala. Gemini 1.5 amplía la cantidad de tokens a 1 millón.
Al ser un sistema con capacidades multimodales, esta ampliación en la ventana contextual permite a Gemini 1.5 abrir nuevas formas de interactuar con el modelo. Así, sus capacidades van desde la interpretación de libros enteros, colecciones de documentos, vídeos largos (como películas o series completas), audios o decenas de miles de líneas de código.
Con la llegada de Gemini 1.5, Google también actualizó el modelo Gemini 1.0 para reducir el precio de su versión estable. Esto se aplicará a los programadores que quieran crear servicios y plataformas basados en la versión anterior del modelo.