Due anni dopo il boom dell’IA generativa, il settore si sta spostando verso agenti AI capaci di eseguire azioni al posto degli utenti. Anthropic, Google DeepMind e OpenAI hanno sviluppato modelli sperimentali che navigano autonomamente sul web e interagiscono con le interfacce per svolgere compiti quotidiani, come compilare moduli, fare acquisti online e prenotare viaggi e ristoranti. Attualmente l’accesso agli agenti AI è riservato agli sviluppatori e agli utenti premium. Secondo le previsioni, entro la fine dell’anno saranno disponibili anche al grande pubblico.
Anthropic è stata la prima a introdurre questa tecnologia con Claude, che può interagire con qualsiasi applicazione desktop analizzando screenshot. Google DeepMind ha presentato Mariner, che opera solo su Chrome, mentre OpenAI ha lanciato Operator, accessibile solo agli utenti premium, con l’obiettivo di espanderlo in futuro. Questi modelli scompongono le richieste in una sequenza di operazioni e richiedono conferma prima di eseguire azioni definitive.
Gli agenti AI non possono gestire login, credenziali o pagamenti. Le stesse compagnie avvertono riguardo ai rischi per la sicurezza, specificando che i modelli sono vulnerabili a potenziali attacchi. Secondo Zachary Lipton, professore di machine learning presso la Carnegie Mellon University, la mancanza di informazioni sul loro funzionamento rende difficile valutarne correttamente i rischi.
Leggi l’articolo completo “Are You Ready to Let an AI Agent Use Your Computer?” su IEEE Spectrum
Immagine generata tramite DALL-E 3. Tutti i diritti sono riservati. Università di Torino (2025)

