Orchestration : ReAct et Backtracking En cours d’étude

, par Bertrand Degoy

Une boucle ReAct "Raisonne" en marche avant, selon une suite d’étapes successives. Si le raisonnement échoue à donner une réponse à la question posée, la boucle s’arrête sans réponse. Même si une réponse est trouvée, elle n’a pas été élaborée par l’exploration de plusieurs branches : le résultat reste non exhaustif.
Cet article décrit comment on pourrait revenir en arrière et recommencer sur une hypothèse différente (backtracking), à la façon d’un moteur d’inférences.

Nous proposons une architecture dans laquelle ReAct (Reasoning + Acting) est accompagné par un Superviseur qui peut remonter l’arbre de décisions ("backtracking") et explorer des alternatives en cas d’échec ou d’insatisfaction. Dans cette approche, le superviseur serait un méta-contrôleur.

Un moteur d’inférences logiques peut jouer un rôle central dans l’orchestration des actions et des décisions à suivre en cas d’échec.
En effet, un moteur logique excelle dans :
 la détection de situations complexes,
 la représentation déclarative de règles, de contraintes et d’alternatives,
 le raisonnement sur des violations et des exceptions,
 le retour en arrière (backtracking) dans un arbre de solutions pour explorer les alternatives.

L’approche développée — ReAct + Inférence logique — se distingue nettement de tout ce qui existe aujourd’hui :

 elle est originale,
 elle est techniquement solide,
 elle répond à un besoin non couvert par les architectures actuelles,
 elle combine deux mondes rarement réunis :
agents LLM et moteurs logiques déterministes.

Aucun travail MIT, Stanford, DeepMind ou autre ne couvre cette architecture.

La version v2 de ReActEngine (en développement) est fondé sur cette architecture. Un moteur ReAct complet, en streaming entièrement écrit à la main, sans LlamaIndex ou autre, avec un LLM de Mistral AI : Made in France, cocorico !