Tag: DPO
Tag: DPO
-

Gli ultimi modelli di linguaggio aperti e il confronto tra DPO e PPO
Il panorama dei LLM ha visto un’esplosione di novità nel mese di aprile 2024, con il rilascio di quattro importanti modelli: Mixtral, Llama 3, Phi-3 e OpenELM. Questi modelli offrono una serie di miglioramenti in termini di dimensioni, prestazioni e strategie di addestramento. Mixtral 8x22B, sviluppato da Mistral AI, si distingue per l’utilizzo dell’architettura MoE…
