Tag: benchmark AI
Tag: benchmark AI
-

Contaminazione dei benchmark e IA: risultati davvero attendibili?
La contaminazione dei benchmark altera i test sull’IA, rendendo i risultati meno affidabili e sollevando dubbi sui progressi dei modelli.
-

Nuovi benchmark per ridurre bias e migliorare equità nei modelli AI
Nuovi benchmark sviluppati da Stanford potrebbero migliorare l’equità nei modelli di IA, riducendo distorsioni e pregiudizi.
-

I benchmark IA sono inadeguati: uno studio evidenzia gli aspetti critici
Sembrerebbe che i benchmark attuali non misurino accuratamente i progressi tecnologici e che influenzino le future regolamentazioni. Leggi di più qui.
-

I Limiti del Ragionamento Matematico dei Large Language Models
Un nuovo studio condotto dai ricercatori di Apple mette in luce significative limitazioni nelle capacità di ragionamento matematico delle moderne Intelligenze Artificiali, anche quelle più avanzate. La ricerca, pubblicata a ottobre 2024, ha analizzato in modo approfondito come i Large Language Models (LLM) – i modelli alla base di sistemi come ChatGPT – affrontano problemi…
