Gemini passe en version 2.0 : ce qui change

Un an après l’introduction de Gemini 1.0, Google dévoile la version 2.0. Ce nouveau modèle se veut plus performant et plus avancé dans le domaine de la multimodalité. Il vise également à accompagner toujours plus l’utilisateur, jusqu’à lui fournir des agents IA. Petit tour d’horizon de ce qui change.

Disponible dès à présent sur la version Web de Gemini, Gemini 2.0 Flash peut être utilisé dans sa version expérimentale en la sélectionnant en haut à gauche. Une fois enregistré avec votre compte Google, il vous suffit de vous rendre sur Gemini suivi de la petite flèche pointant vers le bas. Vous cliquez dessus puis vous sélectionnez “2.0 Flash Experimental” au lieu de “1.5 Flash”, version par défaut.

La sélection de Gemini 2.0 Flash Experimental se fait en haut à gauche de l’écran // Crédits – Geeko

Des améliorations significatives

Ce nouveau modèle est annoncé comme plus complet et performant. Il vise surtout à mieux comprendre les requêtes multimodales, soit celles qui ont recours à un mélange d’informations de natures différentes. Gemini 2.0 a été développé dans l’idée de traiter plus efficacement les demandes contenant du texte, des images ou même du son.

Pour montrer les progrès de son modèle par rapport aux modèles 1.5 Flash et 1.5 Pro, Google a sorti le tableau des benchmarks. À quelques exceptions près, on remarque que Gemini 2.0 Flash Experimental offre des performances améliorées par rapport aux deux autres. En prime, ce nouveau modèle prend en charge nativement des outils comme Google Search et peut exécuter du code.

Tableau comparatif des performances de Gemini 2.0 Flash Experimental par rapport aux modèles 1.5 Flash et 1.5 Pro

Des agents IA

L’une des plus grosses nouveautés concrètes pour les utilisateurs, c’est l’intégration de la fonctionnalité Deep Research. Celle-ci s’associe à un agent IA qui est capable d’exécuter des recherches pour l’utilisateur. Disponible via Gemini Advanced, cet agent dispose de capacités de raisonnement avancées. Il peut donc gérer des sujets plus complexes en résolvant des problèmes en plusieurs étapes. Il peut tout aussi bien être utilisé pour des recherches multimodales spécifiques ou pour résoudre des équations mathématiques. Il dispose d’une meilleure compréhension des textes longs et utilise divers outils natifs pour être toujours plus réactif. Cela se traduit par trois projets en cours.

Projet Astra

Actuellement disponible auprès d’un nombre limité de testeurs, le Projet Astra est un prototype de recherche disponible sur les smartphones Android. La version 2.0 de Gemini améliore les capacités de langage, avec une meilleure compréhension des accents et mots inhabituels. La latence a été réduite et l’agent conversationnel garde désormais en mémoire les échanges durant dix minutes, en plus de se souvenir de conversations passées. Cela lui permet de s’adapter encore plus précisément à l’utilisateur. Enfin, il utilise désormais Google Search, Lens et Maps pour améliorer les résultats de recherche.

Projet Mariner

Toujours dans l’optique d’aider l’utilisateur dans ses requêtes, le projet Mariner prend la forme d’une extension Chrome. Cela permet à l’agent IA de prendre le contrôle du navigateur pour exécuter des recherches complexes. Texte, code, images, formulaires, il est apte à comprendre les divers éléments présents sur le Web et de raisonner à partir de ces derniers. Il peut par exemple analyser les données disponibles au sujet de plusieurs entreprises pour identifier les contacts et les fournir à l’utilisateur. Bien entendu, certaines étapes sensibles restent soumises à la validation de l’utilisateur, comme un achat.

Jules et les autres agents

Avec Jules, Google cible avant tout les développeurs. Cet agent s’intègre au flux GitHub. Spécialisé dans le code, il peut identifier un problème et aider les développeurs à élaborer un plan et un code pour le résoudre. Là encore, le processus se fait sous la supervision d’un humain. D’autres agents sont déployés pour aider à plusieurs niveaux dans le cadre du quotidien. Par exemple, Google présente des agents IA qui peuvent aider les joueurs à progresser dans un jeu vidéo. Comme le montre la vidéo ci-dessous, l’agent interprète les règles du jeu et donne des conseils en direct aux joueurs pour les aider à prendre des décisions.

Une version expérimentale menée à évoluer

Actuellement, Gemini 2.0 est plus à l’aise dans sa langue d’origine (l’anglais), et ce, même s’il est disponible dans d’autres langues, dont le français. Google promet d’améliorer la prise en charge des autres langues dès la courant de l’année prochaine. Dans tous les cas, ce modèle 2.0 Flash Experimental, comme son nom l’indique bien, reste au stade expérimental. Il n’est donc pas exempt d’erreurs ou autres couacs. Mais la firme de Mountain View en a bien conscience et vise à l’améliorer pour l’étendre à d’autres produits Google dès 2025.

 

_
Suivez Geeko sur Facebook, Youtube et Instagram pour ne rien rater de l'actu, des tests et bons plans.

Recevez nos dernières infos directement sur votre WhatsApp en vous abonnant à notre chaine.