Architecture générale des traitements

, par Bertrand Degoy

Cet article décrit comment sont répartis, dans le contexte du RAG, les traitements entre l’ingestion et la génération. Nous nous plaçons dans le cadre de l’ingestion "à froid" où le script ingestcmd.py assure l’ingestion et l’indexation, tandis que des applications utilisent l’index obtenu.

Accès réservé : connectez vous pour en savoir plus.

Notes

[2Notons que cette méthode se contente de Noeuds sans vecteurs, ce qui simplifie le processus d’ingestion.

[3A première vue, l’usage est gratuit. Cependant, il existe une limitation de cadence de l’appel à l’APi en mode SaaS : " API error occurred : Status 429
"message" :"Requests rate limit exceeded"". Serait-elle levée avec un compte Pro ?

[5Notons que cette méthode se contente de Noeuds sans vecteurs, ce qui simplifie le processus d’ingestion.

[6A première vue, l’usage est gratuit. Cependant, il existe une limitation de cadence de l’appel à l’APi en mode SaaS : " API error occurred : Status 429
"message" :"Requests rate limit exceeded"". Serait-elle levée avec un compte Pro ?