概述
WebConfig API是用于管理 Fess Web爬虫设置的API。 您可以操作爬虫目标URL、爬虫深度、排除模式等设置。
基础URL
端点列表
| 方法 | 路径 | 说明 |
|---|---|---|
| GET/PUT | /settings | 获取Web爬虫设置列表 |
| GET | /setting/{id} | 获取Web爬虫设置 |
| POST | /setting | 创建Web爬虫设置 |
| PUT | /setting | 更新Web爬虫设置 |
| DELETE | /setting/{id} | 删除Web爬虫设置 |
获取Web爬虫设置列表
请求
参数
响应
获取Web爬虫设置
请求
响应
创建Web爬虫设置
请求
请求体
字段说明
响应
更新Web爬虫设置
请求
请求体
响应
删除Web爬虫设置
请求
响应
URL模式示例
includedUrls / excludedUrls
| 模式 | 说明 |
|---|---|
.*example\\.com.* | 包含example.com的所有URL |
https://example\\.com/docs/.* | 仅/docs/目录下 |
.*\\.(pdf|doc|docx)$ | PDF、DOC、DOCX文件 |
.*\\?.* | 带查询参数的URL |
.*/(login|logout|admin)/.* | 包含特定路径的URL |
使用示例
企业网站爬虫设置
文档网站爬虫设置
参考信息
Admin API 概述 - Admin API概述
FileConfig API - 文件爬虫设置API
DataConfig API - 数据存储设置API
网页爬取 - Web爬虫设置指南