Crédits : Unsplash

Pourquoi les IA paniquent en jouant à Pokémon

Les modèles d’intelligence artificielle utilisent des probabilités pour fournir des réponses à des requêtes. Les IA ont normalement un comportement dénué d’émotions. Néanmoins, lorsque Gemini ou Claude jouent à Pokémon, les raisonnements paraissent plus humains que ce que l’on peut penser. Explications. 

Si certaines personnes utilisent l’intelligence artificielle pour leurs besoins personnels, d’autres testent les modèles pour déterminer leurs capacités et leurs limites. Récemment, nous avons pu assister à l’impuissance de ChatGPT face à l’Atari 2600 au cours de parties d’échecs. Deux autres IA, à savoir Gemini de Google et Claude d’Anthropic, ont également été testées dans le cadre de jeux vidéo. Plus précisément, l’une avec Pokémon Bleu (version sortie en 1996) et l’autre avec Pokémon Jaune (jeu sorti en 1998).

L’expérience avec Gemini a été menée sur Twitch par Joel Zhang, un développeur indépendant. Elle a permis de générer un rapport de 70 pages analysant le comportement du modèle de Google, plus précisément, la version 2.5 Pro. Sans rentrer dans tous les détails, ce qui ressort, c’est que Gemini 2.5 Pro a “paniqué” lors des combats. Plus exactement, son raisonnement a été dégradé dès lors que les points de vie de ses Pokémon se rapprochaient de 0, et donc d’un K.O.

Bien entendu, l’IA de Google n’a fait que simuler un sentiment de panique. Même si elle n’a pas conscience de ce qu’implique ce sentiment, elle a délaissé certains outils à sa disposition. À la place, elle a agit de manière plus impulsive et hâtive. Son raisonnement semble avoir été biaisé par la volonté de sauver les Pokémon, en prenant la fuite notamment, plutôt qu’en élaborant les stratégies nécessaires pour remporter l’affrontement.

L’expérience similaire menée avec Claude a également mis en avant certains comportements allant à l’encontre de choix réfléchis et logiques ou du moins tenant compte de l’ensemble des règles du jeu. Ainsi, lorsque que Claude a été bloquée au niveau de la grotte du Mont Sélénite, l’IA d’Anthropic a décidé de sacrifier toutes ses créatures. Une stratégie qui, d’après elle, lui permettait de reprendre la partie dans le centre Pokémon le plus proche… Mais elle a omis une règle du jeu : le fait que le centre dans lequel on réapparaît n’est pas le plus proche mais bien le dernier qui a été visité.

Cela démontre que les IA ont encore du chemin pour bien assimiler des règles complexes et les exploiter à bon escient. Néanmoins, les rapports mettent également en évidence certaines facultés qui leur ont permis de résoudre les énigmes du jeu. Même si cela a pris 813 heures à Gemini 2.5 Pro pour finir une première partie, l’IA a su s’améliorer en divisant par deux le temps (406,5 heures) lors de la deuxième partie.

 

_
Suivez Geeko sur Facebook, Youtube et Instagram pour ne rien rater de l'actu, des tests et bons plans.

Recevez nos dernières infos directement sur votre WhatsApp en vous abonnant à notre chaine.