Magazine Intelligenza Artificiale: l'IA è più di quello che appare

Gemini 2.5 Pro e Claude si sfidano al videogioco dei Pokemon

Marta Baronio

20/06/2025

Le IA di Google e Anthropic si sono sfidate in una gara di gaming in Pokémon. Tra le osservazioni che ne derivano, interessante è ciò che emerge dal rapporto di Google DeepMind che evidenzia come Gemini 2.5 Pro abbia mostrato un comportamento simile al panico quando i suoi Pokémon sono vicini alla sconfitta, causando un calo temporaneo nella capacità di ragionamento del modello. Sembrerebbe che pur non provando emozioni, l’IA assuma decisioni affrettate che ricordano il comportamento umano sotto stress.

Parallelamente, Claude, il modello di Anthropic, ha mostrato errori considerati come curiosi, ad esempio i tentativi di “suicidio” nel gioco, conseguenza di una comprensione errata delle meccaniche di teletrasporto ai Centri Pokémon. Nonostante queste difficoltà, Gemini 2.5 Pro eccelle nella risoluzione di enigmi complessi, grazie anche a strumenti specifici creati autonomamente per affrontare puzzle strategici nel gioco.

Questa esperienza evidenzia le sfide ancora aperte nel campo dell’IA, come la capacità di problem solving e i limiti nel comportamento “emotivo” simulato. Google suggerisce che future versioni potrebbero includere moduli per gestire meglio queste situazioni di “panico”, migliorando così l’efficacia del modello in contesti complessi.

Leggi l’articolo completo: Google’s Gemini has beaten Pokémon Blue (with a little help) su techcrunch.com.

Immagine generata tramite DALL-E 3. Tutti i diritti sono riservati. Università di Torino (2025).