• LinkedIn
  • Telegram
  • FB
  • FB

Magazine Intelligenza Artificiale: l'IA è più di quello che appare

Magazine Intelligenza Artificiale: l'IA è più di quello che appare

Hollywood e IA: il ruolo di OpenSubtitles nell’addestramento LLM

Hollywood

Un vasto set di sottotitoli cinematografici e televisivi, preso dal sito OpenSubtitles.org, è stato utilizzato per addestrare sistemi di IA sviluppati da big tech quali Apple, Meta, Anthropic e Nvidia. Il database, che fa parte di una raccolta di dati utilizzata per costruire modelli linguistici avanzati, comprende dialoghi di più di 53.000 film e 85.000 episodi televisivi, tra cui titoli iconici come “Il Padrino”, “Breaking Bad” e “I Simpson”. 

I sottotitoli vengono utilizzati nell’addestramento degli LLM che vengono impiegati dai chatbot per migliorarne la naturalezza delle conversazioni. Tuttavia, il loro uso genera dubbi legati a questioni legali e morali, dal momento in cui spesso avviene senza il consenso degli autori delle opere originali. Infatti, questo utilizzo ha generato critiche da parte di artisti e sceneggiatori che vedono i propri lavori sfruttati senza autorizzazione, alimentando programmi in grado di replicare la creatività umana in maniera sorprendente anche se non perfetta. Le aziende sostengono che il loro utilizzo rientri nel “fair use”, ma la legalità di queste pratiche è ancora oggetto di dibattito e cause legali.

Il database OpenSubtitles, facilmente accessibile online, non identifica chiaramente la provenienza dei dialoghi, complicando ulteriormente la questione della trasparenza e del consenso.

Leggi l’articolo completo: The Hollywood AI Database su theatlantic.com.

Immagine generata tramite DALL-E 3.

Esplora altri articoli su questi temi