Tag: benchmark prestazioni
Tag: benchmark prestazioni
-

I risultati del K Prize mostrano i limiti dell’AI nella programmazione
I risultati del K Prize mostrano il gap tra hype e capacità concrete dell'intelligenza artificiale nel coding. Leggi l'articolo su MagI
-

Amodei: i modelli AI allucinano meno degli esseri umani
Secondo il CEO di Anthropic Dario Amodei, gli attuali modelli AI allucinano meno degli esseri umani. Approfondisci qui
-

Qwen3: evoluzione nei modelli linguistici e prestazioni avanzate
Alibaba ha rilasciato Qwen3, nuovo modello linguistico open source con prestazioni avanzate in codifica, matematica e ragionamento. Leggi qui
-

Musk presenta Grok 3, la nuova intelligenza artificiale di xAI
Musk ha presentato Grok 3, la nuova versione del chatbot sviluppato dalla sua società di intelligenza artificiale, xAI. Approfondisci qui
-

DeepSeek, da dove viene la startup che fa tremare i leader dell’IA
Da dove viene DeepSeek, la startup che sta facendo scricchiolare il vantaggio competitivo dei leader del settore?
-

DeepSeek-R1: Il modello che sfida OpenAI con il reinforcement learning e rivoluziona il ragionamento delle AI
Mentre i large language model continuano a evolversi, un nuovo protagonista entra in scena: DeepSeek-R1, un modello sviluppato da DeepSeek-AI che rivaleggia con i modelli più avanzati di OpenAI grazie a un approccio innovativo basato sul reinforcement learning (RL). Senza dati supervisionati iniziali, questo modello ha “imparato a ragionare” autonomamente, superando sfide matematiche, di coding…

