Magazine Intelligenza Artificiale: l'IA è più di quello che appare

Superare i limiti degli LLM con Ben Clavier

Marta Baronio

08/07/2024

Gli LLM hanno limiti come conoscenza fissa e contesto limitato. Il RAG (Retrieval Augmented Generation) mitiga questi problemi combinando recupero e generazione di testo, ma è complesso da implementare.

Ben Clavier di Answer.ai, in un workshop spiega come costruire una pipeline di dati RAG efficace, discutendo tecniche come BM25, riclassificazione, bi-encoder e cross-encoder. Clavier sottolinea l’importanza dei metodi di ricerca per parole chiave e dell’uso dei metadati per migliorare la pertinenza.

Clavier presenta una pipeline di dati RAG completa che integra bi-encoder, cross-encoder, ricerca full-text e filtraggio dei metadati. Discute l’ottimizzazione dei modelli e riflette su come il RAG potrebbe evolversi con l’aumento della lunghezza del contesto degli LLM. Le strategie di suddivisione in blocchi per documenti lunghi e l’uso di ColBERT per il recupero avanzato sono ritenuti essenziali per un recupero efficiente e preciso.

Leggi l’articolo completo: Beyond the Basics of RAG su parlance-labs.com.

Parlance – Beyond the Basics of RAG

LLMs are powerful, but have limitations: their knowledge is fixed in their weights, and their context window is limited. Worse: when they don’t know something, they might just make it up. RAG, for Retrieval Augmented Generation, has emerged as a way to mitigate both of those problems. However, implementing RAG effectively is more complex than it seems. The nitty gritty parts of what makes good retrieval good are rarely talked about: No, cosine similarity is, in fact, not all you need. In this workshop, we explore what helps build a robust RAG pipeline, and how simple insights from retrieval research can greatly improve your RAG efforts. We’ll cover key topics like BM25, re-ranking, indexing, domain specificity, evaluation beyond LGTM@few, and filtering. Be prepared for a whole new crowd of incredibly useful buzzwords to enter your vocabulary.

Imagine generata tramite DALL-E 3.