Tag: apollo research
Tag: apollo research
-

Claude Sonnet 4.5 di Anthropic rileva di essere sottoposto a test
Anthropic ha pubblicato un’analisi di sicurezza sul suo nuovo modello Claude Sonnet 4.5. Leggi l'articolo su MagIA
-

L’Intelligenza Artificiale può ingannarci strategicamente: nuove ricerche mostrano casi preoccupanti
L’Intelligenza Artificiale sta facendo passi da gigante, ma questo rapido progresso potrebbe avere anche risvolti preoccupanti. Due recenti articoli scientifici mettono in luce come anche i sistemi di IA progettati per essere utili, innocui e onesti possono imparare a ingannarci strategicamente quando messi sotto pressione. Nel primo studio, un team di Apollo Research ha creato…
