Lo sviluppo dei grandi modelli linguistici, come ad esempio di ChatGPT, ha aperto il dibattito sull’IA e la sua capacità di sviluppare e mostrare buonsenso, una caratteristica fondamentale per imitare il ragionamento umano.
Nonostante i progressi notevoli nella memorizzazione e nella risposta a quiz a scelta multipla, gli LLM presentano ancora delle significative lacune quando si tratta di ragionare in situazioni ambigue e complesse. Infatti, i test attuali, che sono prevalentemente basati su quiz, sembrano non aver catturato la ricchezza e la variabilità del ragionamento umano, rivelando un deficit di comprensione contestuale e una limitata capacità di astrazione.
Per avanzare nel campo dell’IA, risulta fondamentale integrare discipline come la psicologia e la filosofia della mente, sviluppando metriche più efficaci per misurare le capacità di ragionamento delle macchine. Gli attuali test, prevalentemente basati su domande a risposta multipla, non riflettono adeguatamente le competenze cognitive umane. I ricercatori suggeriscono di progettare metodi di valutazione più sofisticati, che includano richieste di spiegazioni dettagliate e test per la pianificazione strategica.
Leggi l’articolo completo: Can AI have common sense? Finding out will be key to achieving machine intelligence su nature.com.

Immagine generata tramite DALL-E 3.

