• LinkedIn
  • Telegram
  • FB
  • FB

Magazine Intelligenza Artificiale: l'IA è più di quello che appare

Magazine Intelligenza Artificiale: l'IA è più di quello che appare

Scraping AI, archivi di biblioteche e collezioni aperte in sovraccarico

Un robot umanoide che sistema dei documenti

Uno studio del GLAM-E Lab osserva come i bot di scraping per l’addestramento dell’IA stiano sovraccaricando i server di biblioteche, archivi e musei, causando interruzioni di servizio che rendono inaccessibili risorse e archivi pubblici. La ricerca ha coinvolto 43 istituzioni tra Europa, Nord America e Oceania, mettendo a fuoco per la prima volta su scala sistematica un fenomeno finora osservato solo aneddoticamente.

I dati mostrano che 39 delle 43 organizzazioni intervistate hanno registrato un aumento anomalo del traffico, e di queste, 27 attribuiscono direttamente il fenomeno ai bot IA, mentre altre 7 lo considerano una concausa probabile. Gli effetti vanno dal disagio alla paralisi totale: alcuni istituti subiscono quotidianamente episodi di sovraccarico simili ad attacchi DDoS della durata di circa tre minuti. In altri casi, archivi specializzati che normalmente ricevono poche visite giornaliere vengono improvvisamente travolti da migliaia di richieste simultanee. Ad esempio, un episodio ha interessato un catalogo online dell’Università del North Carolina, che è diventato inaccessibile a studenti e docenti e ha richiesto l’intervento di sette tecnici per una settimana.

Il problema è aggravato dal mancato rispetto del protocollo robots.txt – uno standard che da anni regola il comportamento dei crawler sul web – da parte dei bot IA. La questione mette le istituzioni culturali in una situazione difficile: adottando misure per proteggere i loro contenuti, rischiano di rendere le collezioni meno accessibili al pubblico. Allo stesso tempo però, spesso non hanno le competenze tecniche o le risorse necessarie per implementare e sostenere soluzioni di protezione efficaci.

Leggi l’articolo completo AI Scraping Bots Are Breaking Open Libraries, Archives, and Museums su 404Media

Immagine generata tramite DALL-E 3. Tutti i diritti sono riservati. Università di Torino (2025).

Esplora altri articoli su questi temi