La contextual compression est un sujet qui est devenu central dans les RAG modernes.
C’est une technique qui permet de réduire dynamiquement - c’est à dire en fonction du contexte - la quantité de texte envoyée au LLM en ne gardant que ce qui est pertinent pour la requête.
On ne renvoit pas les (...)
lire la suite