benchmark prestazioni Archives

I risultati del K Prize mostrano i limiti dell’AI nella programmazione

I risultati del K Prize mostrano il gap tra hype e capacità concrete dell'intelligenza artificiale nel coding. Leggi l'articolo su MagI

24/07/2025

Amodei: i modelli AI allucinano meno degli esseri umani

Secondo il CEO di Anthropic Dario Amodei, gli attuali modelli AI allucinano meno degli esseri umani. Approfondisci qui

24/05/2025

Qwen3: evoluzione nei modelli linguistici e prestazioni avanzate

Alibaba ha rilasciato Qwen3, nuovo modello linguistico open source con prestazioni avanzate in codifica, matematica e ragionamento. Leggi qui

30/04/2025

Ricercatori Microsoft rilasciano modello IA BitNet per CPU standard

I ricercatori di Microsoft hanno rilasciato un modello IA BitNet open source, leggero ed efficiente. Approfondisci qui

19/04/2025

Musk presenta Grok 3, la nuova intelligenza artificiale di xAI

Musk ha presentato Grok 3, la nuova versione del chatbot sviluppato dalla sua società di intelligenza artificiale, xAI. Approfondisci qui

21/02/2025

DeepSeek, da dove viene la startup che fa tremare i leader dell’IA

Da dove viene DeepSeek, la startup che sta facendo scricchiolare il vantaggio competitivo dei leader del settore?

28/01/2025

DeepSeek-R1: Il modello che sfida OpenAI con il reinforcement learning e rivoluziona il ragionamento delle AI

Mentre i large language model continuano a evolversi, un nuovo protagonista entra in scena: DeepSeek-R1, un modello sviluppato da DeepSeek-AI che rivaleggia con i modelli più avanzati di OpenAI grazie a un approccio innovativo basato sul reinforcement learning (RL). Senza dati supervisionati iniziali, questo modello ha “imparato a ragionare” autonomamente, superando sfide matematiche, di coding…

27/01/2025

Tag: benchmark prestazioni