Architecture v200

Dernier ajout : 29 juin.

L’architecture v200 porte sur l’organisation de deux chaînes :
– la définition et la construction des modèles,
– la gestion des index selon les thèmes.

Les services ( modèles et index ) sont construits via des loaders spécialisés, normalisés en une facade indépendante des implémentations réelles.

Trois modes de chargement des modèles
24 juin, par Bertrand Degoy

Dans l’architecture v200, les modèles peuvent être chargés de trois manières : via une API distante (comme Mistral), en local sans persistance (chargement HuggingFace classique dans le process), ou en mémoire persistante grâce à un service Pyro5. Les deux premiers modes sont simples mais limités : (...) lire la suite
Construction des modèles : models.json et services.json
23 juin, par Bertrand Degoy

L’architecture v200 repose sur une séparation stricte entre la définition des modèles, leur construction centralisée, et la déclaration des services qui les consomment. Les modèles sont décrits dans un fichier unique (`models.json`), puis construits une seule fois au démarrage par le (...) lire la suite
Chargement des index
25 juin, par Bertrand Degoy

Le chargement des index repose sur une architecture modulaire où chaque composant joue un rôle précis, depuis le daemon initial jusqu’aux services distants qui exploitent les données en RAM. L’objectif est de garantir un chargement efficace, unifié et non redondant des index, tout en permettant une (...) lire la suite
Politique LRU/MRU
29 juin, par Bertrand Degoy

Dans l’architecture Pyro5, les index ( et certains modèles ) sont chargés depuis le disque puis conservés en RAM pour être accessibles rapidement par les services distants. Le daemon joue le rôle de processus maître. Pour les index par exemple, il les expose via IndexServer, et sert de point d’accès (...) lire la suite

Dans la même rubrique

RSS 2.0