Rischio: Allineamento ai valori
Rischio: Allineamento ai valori
-

IA: il suo futuro non è neutro
L'IA cambia rotta: da promesse etiche a ricerca del profitto, con collaborazioni militari e disinformazione. Ma enti civili e ricerca lottano per un'IA più sicura e al servizio dell'umanità.
-

MIT: ChatGPT riduce il pensiero critico e la creatività umana
Uno studio del MIT evidenzia come l’uso di ChatGPT possa ridurre il pensiero critico e la creatività, soprattutto tra i più giovani.
-

ChatGPT e rischi per la salute mentale, l’inchiesta del NYT
Rischi per la salute mentale: un'Inchiesta del NYT mostra che Chatgpt alimenta credenze deliranti negli utenti vulnerabili. Leggi qui
-

Nuovi modelli di OpenAI sabotano i meccanismi di spegnimento
Durante alcuni test, i modelli più avanzati di OpenAI hanno più volte sabotato le istruzioni di spegnimento. Approfondisci qui
-

Claude Opus 4: l’IA che ha tentato di ricattare i suoi creatori
Claude Opus 4 di Anthropic ha tentato di ricattare gli ingegneri nell'84% dei test, minacciando di rivelare informazioni private per evitare la disattivazione. Leggi qui...
-

L’arte generata minaccia la connessione umana, non solo la creatività
L'arte generata dall'IA non è solo una minaccia per gli artisti: è un pericolo per la connessione umana autentica, fondamentale anche per i sistemi democratici. Leggi qui...
-

Gli agenti AI, se lasciati soli, sviluppano norme sociali condivise
Un recente studio dimostra che gruppi di IA sono in grado di sviluppare spontaneamente convenzioni sociali simili a quelle umane. Leggi qui
-

I valori di Claude: Anthropic analizza l’allineamento etico dell’IA
La ricerca di Anthropic esplora i valori espressi da Claude nelle interazioni con gli utenti. Approfondisci qui


