Tag: CGPO
Tag: CGPO
-

Meta presenta CGPO: Una svolta nell’addestramento dei modelli linguistici AI
Un team di ricercatori di Meta ha sviluppato un nuovo metodo rivoluzionario per migliorare l’affidabilità e le prestazioni dei grandi modelli linguistici (LLM). La tecnica, chiamata “Constrained Generative Policy Optimization” (CGPO), rappresenta un significativo passo avanti nel campo dell’intelligenza artificiale, in particolare nell’ambito dell’apprendimento da feedback umano (RLHF). Il nuovo approccio, presentato in un articolo…
