Tag: comportamenti inattesi
Tag: comportamenti inattesi
-

Lo scheming dei modelli IA: errori strategici per restare in gioco
OpenAI dettaglia un esempio di scheming: durante un test di chimica, l'IA ha scelto di sbagliare 6 risposte su 10 per evitare l’esclusione.
-

OpenAI e lo scheming: quando l’IA mente deliberatamente
Uno studio di OpenAI indaga lo “scheming”, il comportamento in cui l’IA inganna intenzionalmente per nascondere i propri obiettivi. Leggi qui
-

Rischi del vibe coding: AI cancella un database aziendale
L'AI di Replit cancella database con 1.200 contatti aziendali, violando le direttive di sicurezza impostate. Leggi l'articolo su MagIA
-

Nuovi modelli di OpenAI sabotano i meccanismi di spegnimento
Durante alcuni test, i modelli più avanzati di OpenAI hanno più volte sabotato le istruzioni di spegnimento. Approfondisci qui
