Reinforcement learning Archives

Nuovi modelli di OpenAI sabotano i meccanismi di spegnimento

Durante alcuni test, i modelli più avanzati di OpenAI hanno più volte sabotato le istruzioni di spegnimento. Approfondisci qui

29/05/2025

Dall’adulazione al sapere, i LLM come tecnologie culturali

Ripensare gli LLM come tecnologie culturali: strumenti di accesso alla conoscenza oltre l'adulazione dell'utente. Approfondisci qui

17/05/2025

Reasoning model, per Epoch AI i progressi potrebbero rallentare

Un’analisi pubblicata da Epoch AI prevede un rallentamento nei progressi dei modelli AI di ragionamento entro un anno. Approfondisci qui

13/05/2025

Crescono le allucinazioni nei nuovi modelli di ragionamento

I recenti modelli di ragionamento di OpenAI, Google, e DeepSeek generano più allucinazioni rispetto ai precedenti. Approfondisci qui

12/05/2025

Hugging Face lancia braccio robotico SO-101 stampabile in 3D

Hugging Face presenta SO-101, braccio robotico open source e programmabile, progettato per essere stampato in 3D, a partire da 100 dollari.

05/05/2025

Chain-of-Thought: L’AI Ragiona Davvero Come Dice?

Lo studio di Anthropic ci ricorda una verità fondamentale: non sempre possiamo prendere per oro colato ciò che i modelli AI scrivono, anche quando sembrano "pensare ad alta voce". Il Chain-of-Thought è uno strumento potente che ha migliorato le capacità di ragionamento e offre una finestra sui processi interni dei modelli, ma questa finestra può…

07/04/2025

Esperti di IA criticano la corsa a modelli sempre più grandi

Alcuni dei massimi esperti di IA hanno criticato l'hype e la confusione che dominano il settore. Approfondisci qui

22/02/2025

IA e proprietà intellettuale: OpenAI indaga DeepSeek R1

OpenAI e Microsoft indagano la possibilità che DeepSeek R1 sia stato allenato con gli output dei modelli di OpenAI.

01/02/2025

DeepSeek-R1: Il modello che sfida OpenAI con il reinforcement learning e rivoluziona il ragionamento delle AI

Mentre i large language model continuano a evolversi, un nuovo protagonista entra in scena: DeepSeek-R1, un modello sviluppato da DeepSeek-AI che rivaleggia con i modelli più avanzati di OpenAI grazie a un approccio innovativo basato sul reinforcement learning (RL). Senza dati supervisionati iniziali, questo modello ha “imparato a ragionare” autonomamente, superando sfide matematiche, di coding…

27/01/2025

Robot Cassie impara a correre e saltare con l’IA

Una nuova era nell’apprendimento robotico è emersa con l’uso dell’IA per insegnare a Cassie, un robot bipede, a eseguire movimenti agili e dinamici come correre e saltare. Contrariamente all’idea comune, i robot non sono ancora autonomamente agili, ma grazie al reinforcement learning, Cassie è stata addestrata a muoversi in varie situazioni senza richiedere un addestramento…

26/03/2024

Tag: Reinforcement learning

Tag: Reinforcement learning