Il New York Times ha sollevato un dibattito riguardo all’utilizzo dei contenuti di YouTube da parte di OpenAI e Google per addestrare i loro modelli di IA, mettendo in discussione la legalità di tali operazioni. Meta cosa ne pensa? Alcuni dipendenti hanno espresso preoccupazioni sul fatto di non riuscire a stare al passo se non seguono il metodo di OpenAI e Google.
La legge sul copyright è complessa e le IA toccano vari aspetti legali come paternità, responsabilità e uso corretto. Oltre ad affrontare la questione legale, potrebbe essere necessario considerare l’economia politica dei contenuti protetti da copyright. Gli editori, incluso il New York Times, sostengono che l’IA danneggi le loro attività in quanto producono riassunti che possono sostituirsi agli articoli originali. Il copyright protegge le espressioni creative uniche, ma non tutti i contenuti sono destinati a essere monetizzati. Esistono meccanismi per indicare quando i contenuti non devono essere utilizzati per l’addestramento dell’IA, ma sono spesso complessi e poco compresi. L’obiettivo di avere un’IA che generi contenuti nel rispetto di ciò che è protetto da copyright può essere raggiunto attraverso tecniche come la RAG (generazione aumentata dal recupero), che associa le risposte IA a fonti specifiche. Tuttavia, la mancanza di trasparenza e infrastrutture generalizzate per rilevare la proprietà dei contenuti rappresenta una sfida. La soluzione potrebbe stare nella creazione di un “book data commons” per la formazione dell’IA, rispettando il copyright e garantendo un compenso ai creatori.
La chiave per un futuro sostenibile nell’IA potrebbe risiedere in modelli di business e tecnologie che incentivino la creazione e la distribuzione equa dei contenuti, valorizzando il lavoro dei creatori e integrando trasparenza e controllo nell’ecosistema digitale.
Leggi l’articolo completo: How to Fix “AI’s Original Sin” su oreilly.com.

Foto di Christina Morillo su Pexels.

