Configuration du mode de recherche IA

Apercu

Le mode de recherche IA (RAG: Retrieval-Augmented Generation) est une fonctionnalite qui enrichit les resultats de recherche de Fess avec un LLM (grand modele de langage) pour fournir des informations sous forme de dialogue. Les utilisateurs peuvent poser des questions en langage naturel et obtenir des reponses detaillees basees sur les resultats de recherche.

Dans Fess 15.6, la fonctionnalite LLM a ete separee en plugins fess-llm-*. La configuration principale et la configuration specifique au fournisseur LLM s’effectuent dans fess_config.properties, et la selection du fournisseur LLM (rag.llm.name) s’effectue dans system.properties ou via l’administration.

Fonctionnement du mode de recherche IA

Le mode de recherche IA fonctionne selon un flux en plusieurs etapes.

Phase d’analyse d’intention : Analyse la question de l’utilisateur et extrait les mots-cles optimaux pour la recherche
Phase de recherche : Recherche des documents avec les mots-cles extraits en utilisant le moteur de recherche Fess
Fallback de regeneration de requete : Lorsqu’aucun resultat n’est trouve, le LLM regenere la requete et reessaie
Phase d’evaluation : Evalue la pertinence des resultats de recherche et selectionne les documents les plus appropries
Phase de generation : Le LLM genere une reponse basee sur les documents selectionnes
Phase de sortie : Retourne la reponse et les informations sources a l’utilisateur (avec rendu Markdown)

Ce flux permet des reponses de haute qualite comprenant le contexte, superieur a la simple recherche par mots-cles. La regeneration de requete ameliore la couverture des reponses lorsque la requete initiale n’est pas optimale.

Configuration de base

La configuration de la fonctionnalite de mode de recherche IA est divisee en configuration principale et en configuration du fournisseur.

Configuration principale (fess_config.properties)

Configuration de base pour activer la fonctionnalite de mode de recherche IA. A configurer dans app/WEB-INF/conf/fess_config.properties.

Configuration du fournisseur (system.properties / administration)

La selection du fournisseur LLM s’effectue via l’administration ou les proprietes systeme.

Via l’administration :

Depuis l’ecran de configuration Administration > Systeme > General, selectionnez le fournisseur LLM a utiliser.

Via system.properties :

Pour la configuration detaillee des fournisseurs LLM, consultez :

Configuration Ollama - Configuration Ollama
Configuration OpenAI - Configuration OpenAI
Configuration Google Gemini - Configuration Google Gemini

Reference rapide des chemins de configuration

Dans Fess 15.6, les parametres sont separes en deux familles : la famille FessConfig (fess_config.properties) et la famille SystemProperty (system.properties, persistee dans OpenSearch). Les chemins de configuration different ; ne pas les confondre.

Propriete	Famille	Passage via Docker / options JVM	UI Admin
`rag.chat.enabled`	FessConfig	`-Dfess.config.rag.chat.enabled=true`	Non
`rag.llm.name`	SystemProperty	`-Dfess.system.rag.llm.name=gemini` (defaut initial uniquement)	Oui (parametres generaux)
`rag.llm.gemini.api.key`	FessConfig	`-Dfess.config.rag.llm.gemini.api.key=...`	Oui
`rag.llm.gemini.model`	FessConfig	`-Dfess.config.rag.llm.gemini.model=...`	Oui
`rag.llm.openai.api.key`	FessConfig	`-Dfess.config.rag.llm.openai.api.key=...`	Oui
`rag.llm.openai.model`	FessConfig	`-Dfess.config.rag.llm.openai.model=...`	Oui
`rag.llm.ollama.api.url`	FessConfig	`-Dfess.config.rag.llm.ollama.api.url=...`	Oui

Note

rag.llm.type est l’ancien nom de propriete dans Fess 15.5 et anterieur. Dans 15.6 et superieur il est renomme en rag.llm.name ; les valeurs ecrites sous rag.llm.type ne sont pas lues.

Liste des configurations principales

Liste des configurations principales disponibles dans fess_config.properties.

Propriete	Description	Valeur par defaut
`rag.chat.enabled`	Activer la fonctionnalite de mode de recherche IA	`false`
`rag.chat.context.max.documents`	Nombre maximum de documents a inclure dans le contexte	`5`
`rag.chat.session.timeout.minutes`	Delai d’expiration de la session (minutes)	`30`
`rag.chat.session.max.size`	Nombre maximum de sessions pouvant etre maintenues simultanement	`10000`
`rag.chat.history.max.messages`	Nombre maximum de messages dans l’historique de conversation	`30`
`rag.chat.content.fields`	Champs a recuperer des documents	`title,url,content,doc_id,content_title,content_description`
`rag.chat.message.max.length`	Nombre maximum de caracteres du message utilisateur	`4000`
`rag.chat.highlight.fragment.size`	Taille du fragment pour l’affichage en surbrillance	`500`
`rag.chat.highlight.number.of.fragments`	Nombre de fragments pour l’affichage en surbrillance	`3`
`rag.chat.history.assistant.content`	Type de contenu a inclure dans l’historique de l’assistant ( `full` / `smart_summary` / `source_titles` / `source_titles_and_urls` / `truncated` / `none` )	`smart_summary`

Parametres de generation

Dans Fess 15.6, les parametres de generation (nombre maximum de tokens, temperature, etc.) se configurent par fournisseur et par type de prompt. Ces configurations sont gerees comme parametres de chaque plugin fess-llm-* et non comme configurations principales.

Pour les details, consultez la documentation de chaque fournisseur :

Configuration Ollama - Parametres de generation Ollama
Configuration OpenAI - Parametres de generation OpenAI
Configuration Google Gemini - Parametres de generation Google Gemini

Configuration du contexte

Configuration du contexte passe au LLM depuis les resultats de recherche.

Configuration principale

Les configurations suivantes s’effectuent dans fess_config.properties.

Propriete	Description	Valeur par defaut
`rag.chat.context.max.documents`	Nombre maximum de documents a inclure dans le contexte	`5`
`rag.chat.content.fields`	Champs a recuperer des documents	`title,url,content,doc_id,content_title,content_description`

Configuration specifique au fournisseur

Les configurations suivantes s’effectuent dans fess_config.properties pour chaque fournisseur.

rag.llm.{provider}.{promptType}.context.max.chars - Nombre maximum de caracteres du contexte
rag.llm.{provider}.chat.evaluation.max.relevant.docs - Nombre maximum de documents pertinents a selectionner lors de la phase d’evaluation

{provider} contient le nom du fournisseur tel que ollama, openai, gemini, etc. {promptType} contient le type de prompt tel que chat, intent_analysis, evaluation, etc.

Pour les details, consultez la documentation de chaque fournisseur.

Champs de contenu

Champs specifiables dans rag.chat.content.fields :

title - Titre du document
url - URL du document
content - Corps du document
doc_id - ID du document
content_title - Titre du contenu
content_description - Description du contenu

Prompt systeme

Dans Fess 15.6, les prompts systeme sont definis dans le DI XML (fess_llm++.xml) de chaque plugin fess-llm-* et non dans les fichiers de proprietes.

Personnalisation des prompts

Pour personnaliser les prompts systeme, surchargez le fichier fess_llm++.xml dans le JAR du plugin.

Recuperez fess_llm++.xml dans le fichier JAR du plugin utilise
Apportez les modifications necessaires
Placez-le dans l’emplacement approprie sous app/WEB-INF/ pour le surcharger

Des prompts systeme differents sont definis pour chaque type de prompt (analyse d’intention, evaluation, generation), avec une optimisation adaptee a chaque usage.

Pour les details, consultez la documentation de chaque fournisseur :

Configuration Ollama - Configuration des prompts Ollama
Configuration OpenAI - Configuration des prompts OpenAI
Configuration Google Gemini - Configuration des prompts Google Gemini

Gestion des sessions

Configuration de la gestion des sessions de chat.

Propriete	Description	Valeur par defaut
`rag.chat.session.timeout.minutes`	Delai d’expiration de la session (minutes)	`30`
`rag.chat.session.max.size`	Nombre maximum de sessions pouvant etre maintenues simultanement	`10000`
`rag.chat.history.max.messages`	Nombre maximum de messages dans l’historique de conversation	`30`

Comportement des sessions

Lorsqu’un utilisateur commence un nouveau chat, une nouvelle session est creee
L’historique de conversation est sauvegarde dans la session, permettant un dialogue contextuel
Les sessions sont automatiquement supprimees apres expiration du delai
Lorsque l’historique depasse le nombre maximum de messages, les anciens messages sont supprimes

Controle de la concurrence

Le nombre de requetes simultanees vers le LLM est controle par fournisseur dans fess_config.properties.

Considerations sur le controle de la concurrence

Tenez compte egalement des limitations de debit cote fournisseur LLM
Dans les environnements a forte charge, il est recommande de configurer des valeurs plus petites
Lorsque la limite de concurrence est atteinte, les requetes entrent dans une file d’attente et sont traitees sequentiellement

Mode d’historique de conversation

rag.chat.history.assistant.content controle la maniere dont les reponses de l’assistant sont stockees dans l’historique de conversation.

Mode	Description
`smart_summary`	(Par defaut) Preserve le debut (60%) et la fin (40%) de la reponse, en remplacant le milieu par un marqueur d’omission. Les titres des sources sont egalement ajoutes
`full`	Preserve la reponse entiere telle quelle
`source_titles`	Preserve uniquement les titres des sources
`source_titles_and_urls`	Preserve les titres et URLs des sources
`truncated`	Tronque la reponse a la limite maximale de caracteres
`none`	Ne preserve pas l’historique

Note

En mode smart_summary, le contexte des longues reponses est preserve efficacement tout en reduisant l’utilisation des tokens. Les paires de messages utilisateur et assistant sont groupees en tours et empaquetees de maniere optimale dans un budget de caracteres. Les limites maximales de caracteres pour l’historique et le resume sont controlees par l’implementation LlmClient de chaque plugin fess-llm-*.

Regeneration de requete

Lorsqu’aucun resultat de recherche n’est trouve ou qu’aucun resultat pertinent n’est identifie, le LLM regenere automatiquement la requete et relance la recherche.

Avec zero resultats de recherche : Regeneration de requete avec raison no_results
Lorsqu’aucun document pertinent n’est trouve : Regeneration de requete avec raison no_relevant_results
Retombe sur la requete originale si la regeneration echoue

Cette fonctionnalite est activee par defaut et integree dans les flux RAG synchrones et en streaming. Les prompts de regeneration de requete sont definis dans chaque plugin fess-llm-*.

Rendu Markdown

Les reponses du mode de recherche IA sont rendues au format Markdown.

Les reponses du LLM sont analysees en Markdown et converties en HTML
Le HTML converti est assaini, n’autorisant que les balises et attributs surs
Prend en charge les titres, listes, blocs de code, tableaux, liens et autres syntaxes Markdown
Cote client, marked.js et DOMPurify sont utilises ; cote serveur, le sanitizer OWASP

Utilisation de l’API

La fonctionnalite de mode de recherche IA est accessible via API REST.

API non-streaming

Point de terminaison : POST /api/v1/chat

Parametres :

Parametre	Requis	Description
`message`	Oui	Message de l’utilisateur
`sessionId`	Non	ID de session (pour continuer la conversation)
`clear`	Non	`true` pour effacer la session

Exemple de requete :

Exemple de reponse :

API streaming

Point de terminaison : POST /api/v1/chat/stream

Envoie les reponses en streaming au format Server-Sent Events (SSE).

Parametres :

Parametre	Requis	Description
`message`	Oui	Message de l’utilisateur
`sessionId`	Non	ID de session (pour continuer la conversation)

Exemple de requete :

Evenements SSE :

Evenement	Description
`phase`	Debut/fin de phase de traitement (intent_analysis, search, evaluation, generation)
`chunk`	Fragment de texte genere
`retry`	Notifie lorsqu’une requete LLM est reessayee (nom de phase, numero de tentative en cours, nombre maximum de tentatives, attente avant la prochaine tentative, cause)
`waiting`	Notifie pendant l’attente d’un permis de controle de concurrence (nom de phase, temps d’attente ecoule, timeout d’attente)
`fallback`	Notifie lorsque la requete est regeneree en raison de l’absence de resultats ou de resultats non pertinents (phase, raison `no_results` ou `no_relevant_results`, requete originale, requete regeneree)
`warning`	Notifie lors d’un fallback silencieux interne (par exemple, epuisement des tokens du modele de raisonnement)
`sources`	Information sur les documents sources
`done`	Traitement termine (sessionId, htmlContent). htmlContent contient la chaine HTML rendue depuis Markdown
`error`	Information d’erreur. Fournit des messages specifiques pour le timeout, le depassement de la longueur du contexte, le modele non trouve, la reponse invalide et les erreurs de connexion

Pour la documentation API detaillee, consultez API Chat.

Interface Web

La fonctionnalite de mode de recherche IA est accessible depuis l’ecran de recherche de l’interface Web Fess.

Demarrer un chat

Accedez a l’ecran de recherche Fess
Cliquez sur l’icone de chat
Le panneau de chat s’affiche

Utiliser le chat

Entrez votre question dans la zone de texte
Cliquez sur le bouton d’envoi ou appuyez sur Entree
La reponse de l’assistant IA s’affiche
La reponse inclut des liens vers les sources

Continuer la conversation

Vous pouvez continuer la conversation dans la meme session de chat
Les reponses tiennent compte du contexte des questions precedentes
Cliquez sur « Nouveau chat » pour reinitialiser la session

Depannage

Le bouton mode IA n’apparait pas sur l’ecran de recherche

Symptome : Le bouton mode IA ne s’affiche pas dans l’en-tete des resultats de recherche, et acceder a /chat redirige vers la page d’accueil.

Liste de verifications : verifier les points suivants dans l’ordre.

rag.chat.enabled=true est-il defini ?
- Docker : -Dfess.config.rag.chat.enabled=true est-il inclus dans FESS_JAVA_OPTS ?
- Installation par paquet : est-il ecrit dans app/WEB-INF/conf/fess_config.properties ?
Le plugin fess-llm-* correspondant est-il installe ?
- Docker : FESS_PLUGINS=fess-llm-gemini:15.6.0 (ou fess-llm-openai / fess-llm-ollama) doit etre defini
- Installation par paquet : le JAR doit etre place dans app/WEB-INF/plugin/
- Le journal de demarrage doit inclure Installing fess-llm-XXX-15.6.0.jar
rag.llm.name correspond-il a un plugin installe ?
- La valeur par defaut est ollama. Si seul le plugin Gemini est installe, vous devez explicitement le definir a gemini (de meme openai pour le plugin OpenAI)
- Methode (a) : modifier rag.llm.name depuis Administration > Systeme > General (section RAG) et enregistrer
- Methode (b) : inclure -Dfess.system.rag.llm.name=gemini dans FESS_JAVA_OPTS au demarrage. N’agit que comme valeur par defaut initiale avant qu’une valeur ne soit persistee dans OpenSearch
Un WARN comme [LLM] LlmClient not found. componentName=ollamaLlmClient se repete-t-il dans le journal ?
- Symptome typique quand rag.llm.name est encore ollama mais que le plugin Ollama n’est pas installe
- Definir rag.llm.name au fournisseur reellement utilise resout le probleme
- De meme, componentName=geminiLlmClient indique que rag.llm.name=gemini est defini mais que le plugin fess-llm-gemini n’est pas installe
La cle d’API specifique au fournisseur est-elle configuree ?
- Quand rag.llm.gemini.api.key / rag.llm.openai.api.key est vide, checkAvailabilityNow retourne false et le mode IA est desactive
- Activer DEBUG sur org.codelibs.fess.llm.gemini dans log4j2.xml fait apparaitre des messages comme [LLM:GEMINI] Gemini is not available. apiKey is blank
L’hote Fess peut-il atteindre le fournisseur LLM ?
- Pour les API cloud (Gemini / OpenAI), le conteneur doit avoir un acces sortant a Internet
- En cas de proxy, definissez http.proxy.host / http.proxy.port (et au besoin http.proxy.username / http.proxy.password) dans fess_config.properties. Dans un environnement Docker, ajoutez -Dfess.config.http.proxy.host=... -Dfess.config.http.proxy.port=... a FESS_JAVA_OPTS (depuis Fess 15.6.1, les clients LLM partagent la configuration de proxy commune a Fess)

Note

La page « General » n’expose pas de case a cocher pour rag.chat.enabled (par conception). Cette propriete de la famille FessConfig ne peut etre definie qu’a travers fess_config.properties ou -Dfess.config.rag.chat.enabled=true.

Le mode de recherche IA ne s’active pas

Points a verifier :

Verifier si rag.chat.enabled=true est configure
Verifier si le fournisseur LLM est correctement configure dans rag.llm.name
Verifier si le plugin fess-llm-* correspondant est installe
Verifier si la connexion au fournisseur LLM est possible

Qualite des reponses insuffisante

Ameliorations :

Utiliser un modele LLM plus performant
Augmenter rag.chat.context.max.documents
Personnaliser le prompt systeme dans le DI XML
Ajuster les parametres de temperature specifiques au fournisseur (consultez la documentation de chaque plugin fess-llm-*)

Reponses lentes

Ameliorations :

Utiliser un modele LLM plus rapide (ex : Gemini Flash)
Reduire les parametres max.tokens specifiques au fournisseur (consultez la documentation de chaque plugin fess-llm-*)
Reduire rag.chat.context.max.documents

Sessions non maintenues

Points a verifier :

Verifier si le sessionId est correctement envoye cote client
Verifier le parametre rag.chat.session.timeout.minutes
Verifier la capacite de stockage des sessions

Configuration de debogage

Pour investiguer les problemes, ajustez le niveau de log pour afficher des logs detailles.

app/WEB-INF/classes/log4j2.xml :

Les messages de log utilisent le prefixe [RAG], avec des sous-prefixes tels que [RAG:INTENT], [RAG:EVAL] et [RAG:ANSWER] pour chaque phase. Au niveau INFO, les logs de fin de chat (duree, nombre de sources) sont emis. Au niveau DEBUG, les details d’utilisation des tokens, de controle de concurrence et d’empaquetage de l’historique sont emis.

Journal de recherche et type d’acces

Les recherches via le mode de recherche IA sont enregistrees avec le nom du fournisseur LLM (par ex. ollama, openai, gemini) comme type d’acces dans les journaux de recherche. Cela permet de distinguer les recherches du mode IA des recherches web ou API regulieres dans les analyses.

Informations de reference

Apercu de l’integration LLM - Apercu de l’integration LLM
Configuration Ollama - Configuration Ollama
Configuration OpenAI - Configuration OpenAI
Configuration Google Gemini - Configuration Google Gemini
API Chat - Reference API Chat
Mode de recherche IA - Guide de recherche par chat pour les utilisateurs