Le ultime novità lanciate da OpenAI sembrano inserirsi nella più ampia strategia della startup verso lo sviluppo dell’IA agentica.
Tra queste, Realtime API permette ai programmatori di generare voci e implementare funzioni e modalità vocali all’interno di applicazioni e software.
Olivier Godement, responsabile del prodotto per quanto riguarda lo sviluppo della piattaforma di OpenAI, spiega che la possibilità di interagire in modo naturale attraverso la voce costituirà una feature fondamentale dell’esperienza d’uso degli agenti AI.
Godement riferisce anche che superare gli ostacoli relativi alla connessione con strumenti diversi è centrale per permettere agli agenti AI di reperire informazioni aggiornate e svolgere task complesse. In questo senso ChatGPT Search, la nuova funzione in grado di svolgere ricerche sul web, rappresenta un’importante primo passo nella direzione di quest’esigenza tecnica, fornendo l’infrastruttura necessaria allo sviluppo di agenti AI capaci e utili.
Tuttavia, rimane da affrontare la sfida sul piano delle capacità di ragionare; il modello o1, che utilizza soluzioni avanzate di machine learning per riconoscere e correggere errori, scomporre problemi e provare differenti approcci nel produrre risultati, riesce sì a svolgere alcune task, ma non in maniera affidabile. Pur accennando a promettenti ricerche in questa direzione, Godement ammette che c’è ancora molto lavoro da fare.
Intanto, per il prossimo anno Godement si aspetta un’importante crescita dell’adozione dell’IA nel comparto del customer care e delle mansioni legate all’assistenza.
Leggi l’articolo completo su “How ChatGPT search paves the way for AI agents” su MIT Technology Review

Immagine generata con DALL-E 3

