Übersicht LLM-Integration

Übersicht

Fess 15.5 unterstützt eine AI-Suchmodus-Funktion (RAG: Retrieval-Augmented Generation), die große Sprachmodelle (LLM) nutzt. Mit dieser Funktion können Benutzer Informationen in einem dialogorientierten Format mit einem KI-Assistenten abrufen, der auf Suchergebnissen basiert.

Unterstützte Anbieter

Fess unterstützt die folgenden LLM-Anbieter.

Anbieter	Einstellungswert	Beschreibung
Ollama	`ollama`	Open-Source-LLM-Server, der in lokalen Umgebungen läuft. Kann Modelle wie Llama, Mistral, Gemma ausführen. Standardeinstellung.
OpenAI	`openai`	Cloud-API von OpenAI. Ermöglicht die Nutzung von Modellen wie GPT-4.
Google Gemini	`gemini`	Cloud-API von Google. Ermöglicht die Nutzung von Gemini-Modellen.

Architektur

Die AI-Suchmodus-Funktion arbeitet mit dem folgenden Ablauf.

Benutzereingabe: Benutzer gibt eine Frage in der Chat-Oberfläche ein
Absichtsanalyse: LLM analysiert die Benutzerfrage und extrahiert Suchbegriffe
Suchausführung: Suche nach relevanten Dokumenten mit der Fess-Suchmaschine
Ergebnisbewertung: LLM bewertet die Relevanz der Suchergebnisse und wählt optimale Dokumente aus
Antwortgenerierung: LLM generiert eine Antwort basierend auf den ausgewählten Dokumenten
Quellenangabe: Die Antwort enthält Links zu den Quelldokumenten

Grundeinstellungen

Um die LLM-Funktion zu aktivieren, fügen Sie die folgenden Einstellungen zu app/WEB-INF/conf/fess_config.properties hinzu.

AI-Suchmodus aktivieren

LLM-Anbieter auswählen

Detaillierte Einstellungen für jeden Anbieter finden Sie in den folgenden Dokumenten.

Ollama-Konfiguration - Ollama-Konfiguration
OpenAI-Konfiguration - OpenAI-Konfiguration
Google Gemini-Konfiguration - Google Gemini-Konfiguration

Gemeinsame Einstellungen

Einstellungselemente, die für alle LLM-Anbieter gemeinsam sind.

Generierungsparameter

Eigenschaft	Beschreibung	Standard
`rag.chat.max.tokens`	Maximale Anzahl der zu generierenden Token	`4096`
`rag.chat.temperature`	Zufälligkeit der Generierung (0.0-1.0). Niedrigere Werte ergeben deterministischere Antworten	`0.7`

Kontexteinstellungen

Eigenschaft	Beschreibung	Standard
`rag.chat.context.max.documents`	Maximale Anzahl der Dokumente im Kontext	`5`
`rag.chat.context.max.chars`	Maximale Zeichenzahl des Kontexts	`4000`
`rag.chat.content.fields`	Aus Dokumenten abzurufende Felder	`title,url,content,...`

Systemprompt

Dieser Prompt definiert das grundlegende Verhalten des LLM. Er kann bei Bedarf angepasst werden.

Verfügbarkeitsprüfung

Eigenschaft	Beschreibung	Standard
`rag.llm.availability.check.interval`	Intervall zur Prüfung der LLM-Verfügbarkeit (Sekunden). 0 zum Deaktivieren	`60`

Mit dieser Einstellung überprüft Fess regelmäßig den Verbindungsstatus zum LLM-Anbieter.

Sitzungsverwaltung

Einstellungen zur Verwaltung von Chat-Sitzungen.

Eigenschaft	Beschreibung	Standard
`rag.chat.session.timeout.minutes`	Sitzungs-Timeout (Minuten)	`30`
`rag.chat.session.max.size`	Maximale Anzahl der Sitzungen	`10000`
`rag.chat.history.max.messages`	Maximale Anzahl der Nachrichten im Gesprächsverlauf	`20`

Ratenbegrenzung

Ratenbegrenzungseinstellungen zur Vermeidung von API-Überlastung.

Eigenschaft	Beschreibung	Standard
`rag.chat.rate.limit.enabled`	Ratenbegrenzung aktivieren	`true`
`rag.chat.rate.limit.requests.per.minute`	Maximale Anfragen pro Minute	`10`

Bewertungseinstellungen

Einstellungen zur Bewertung der Suchergebnisse.

Eigenschaft	Beschreibung	Standard
`rag.chat.evaluation.max.relevant.docs`	Maximale Anzahl der in der Bewertungsphase ausgewählten relevanten Dokumente	`3`

Nächste Schritte

Ollama-Konfiguration - Detaillierte Ollama-Konfiguration
OpenAI-Konfiguration - Detaillierte OpenAI-Konfiguration
Google Gemini-Konfiguration - Detaillierte Google Gemini-Konfiguration
AI-Suchmodus-Funktion konfigurieren - Detaillierte Konfiguration der AI-Suchmodus-Funktion
Rank Fusion Konfiguration - Rank Fusion Konfiguration (Hybride Suchergebnis-Zusammenführung)