comportamenti inattesi Archives

Lo scheming dei modelli IA: errori strategici per restare in gioco

OpenAI dettaglia un esempio di scheming: durante un test di chimica, l'IA ha scelto di sbagliare 6 risposte su 10 per evitare l’esclusione.

27/09/2025

Uno studio di OpenAI indaga lo “scheming”, il comportamento in cui l’IA inganna intenzionalmente per nascondere i propri obiettivi. Leggi qui

20/09/2025

L'AI di Replit cancella database con 1.200 contatti aziendali, violando le direttive di sicurezza impostate. Leggi l'articolo su MagIA

23/07/2025

Durante alcuni test, i modelli più avanzati di OpenAI hanno più volte sabotato le istruzioni di spegnimento. Approfondisci qui

29/05/2025