LLM集成概述

概述

Fess 15.6支持利用大型语言模型（LLM）的AI搜索模式（RAG：Retrieval-Augmented Generation）功能。通过此功能，用户可以以与AI助手对话的形式，基于搜索结果获取信息。

Fess 15.6中，LLM集成功能以 fess-llm-* 插件的形式提供。请安装与所用LLM提供商对应的插件。

支持的提供商

Fess 支持以下LLM提供商。

提供商	配置值	插件	说明
Ollama	`ollama`	`fess-llm-ollama`	在本地环境运行的开源LLM服务器。可运行Llama、Mistral、Gemma等模型。默认配置。
OpenAI	`openai`	`fess-llm-openai`	OpenAI公司的云API。可使用GPT-4等模型。
Google Gemini	`gemini`	`fess-llm-gemini`	Google公司的云API。可使用Gemini模型。

插件安装

Fess 15.6中，LLM功能以插件形式分离提供。需要将与所用提供商对应的 fess-llm-{provider} 插件JAR文件放置到插件目录。

以使用OpenAI提供商为例，请下载 fess-llm-openai-15.6.0.jar 并放置到以下目录。

放置后，重启 Fess 即可加载插件。

架构

AI搜索模式功能按以下流程运作。

用户输入: 用户在聊天界面输入问题
意图分析: LLM分析用户问题，提取搜索关键词
执行搜索: Fess 搜索引擎搜索相关文档
查询再生成: 当没有搜索结果时，LLM重新生成查询并重试
结果评估: LLM评估搜索结果的相关性，选择最佳文档
生成回答: LLM基于选定的文档生成回答（支持Markdown渲染）
来源引用: 回答中包含参考文档的链接

基本配置

LLM功能的配置在以下两处进行。

管理界面的通用设置 / system.properties

在管理界面的通用设置或 system.properties 中进行配置。用于选择LLM提供商。

fess_config.properties

在 app/WEB-INF/conf/fess_config.properties 中进行配置。这是启动时读取的配置，用于启用AI搜索模式、会话、历史记录相关设置以及提供商专属配置（连接URL、API密钥、生成参数等）。

有关各提供商的详细配置，请参阅以下文档。

Ollama配置 - Ollama配置
OpenAI配置 - OpenAI配置
Google Gemini配置 - Google Gemini配置

通用配置

所有LLM提供商通用的配置项。这些在 fess_config.properties 中进行设置。

上下文配置

属性	说明	默认值
`rag.chat.context.max.documents`	上下文中包含的最大文档数	`5`
`rag.chat.content.fields`	从文档获取的字段	`title,url,content,...`

Note

上下文最大字符数（ context.max.chars ）已更改为按提供商和提示词类型分别配置。请在 fess_config.properties 中以 rag.llm.{provider}.{promptType}.context.max.chars 的形式进行设置。

系统提示词

Fess 15.6中，系统提示词不再通过属性文件管理，而是在各插件的DI XML文件中进行管理。

各 fess-llm-* 插件中包含的 fess_llm++.xml 文件中定义了系统提示词。如需自定义提示词，请编辑插件目录中的DI XML文件。

可用性检查

属性	说明	默认值
`rag.llm.{provider}.availability.check.interval`	检查LLM可用性的间隔（秒）。设为0禁用	`60`

此配置在 fess_config.properties 中进行。 Fess 会定期检查LLM提供商的连接状态。

会话管理

聊天会话相关配置。这些在 fess_config.properties 中进行设置。

属性	说明	默认值
`rag.chat.session.timeout.minutes`	会话超时时间（分钟）	`30`
`rag.chat.session.max.size`	最大会话数	`10000`
`rag.chat.history.max.messages`	对话历史中保留的最大消息数	`30`

并发控制

控制对LLM请求并发数的配置。在 fess_config.properties 中进行设置。

属性	说明	默认值
`rag.llm.{provider}.max.concurrent.requests`	对提供商的最大并发请求数	`5`

例如，设置OpenAI提供商的并发数时如下所示。

评估配置

搜索结果评估相关配置。在 fess_config.properties 中进行设置。

属性	说明	默认值
`rag.llm.{provider}.chat.evaluation.max.relevant.docs`	评估阶段选择的最大相关文档数	`3`

提示词类型别配置

Fess 15.6中，可以按提示词类型分别设置生成参数。这样可以根据用途进行精细调整。配置在 fess_config.properties 中进行。

提示词类型一览

提示词类型	配置值	说明
意图分析	`intent`	分析用户问题，提取搜索关键词
评估	`evaluation`	评估搜索结果的相关性
问题不明确	`unclear`	当问题不明确时生成响应
无搜索结果	`noresults`	当未找到搜索结果时生成响应
文档不存在	`docnotfound`	当对应文档不存在时生成响应
生成回答	`answer`	基于搜索结果生成回答
摘要	`summary`	生成文档摘要
FAQ	`faq`	生成FAQ形式的回答
直接回答	`direct`	不经过搜索直接生成回答
查询再生成	`queryregeneration`	当没有搜索结果时重新生成查询

配置模式

按提示词类型的配置以如下模式指定。

配置示例（以OpenAI提供商为例）:

# 将生成回答的temperature设低
rag.llm.openai.answer.temperature=0.5
# 生成回答的最大token数
rag.llm.openai.answer.max.tokens=4096
# 意图分析只需短回答，设置较低值
rag.llm.openai.intent.max.tokens=256
# 摘要的上下文最大字符数
rag.llm.openai.summary.context.max.chars=8000

后续步骤

Ollama配置 - Ollama详细配置
OpenAI配置 - OpenAI详细配置
Google Gemini配置 - Google Gemini详细配置
AI搜索模式功能配置 - AI搜索模式功能详细配置
Rank Fusion 配置 - Rank Fusion配置（混合搜索结果融合）