概述
CrawlingInfo API是用于查看和管理 Fess 爬虫信息(爬虫会话)的API。 可以执行爬虫会话的列表获取、单个获取、删除等操作。
基础URL
端点列表
| 方法 | 路径 | 说明 |
|---|---|---|
| GET | /logs | 获取爬虫信息列表 |
| GET | /log/{id} | 获取爬虫信息 |
| DELETE | /log/{id} | 删除爬虫信息 |
| DELETE | /all | 批量删除爬虫会话(不含运行中) |
获取爬虫信息列表
请求
参数
| 参数 | 类型 | 必需 | 说明 |
|---|---|---|---|
size | Integer | 否 | 每页记录数(默认: 20) |
page | Integer | 否 | 页码(从1开始,默认: 1) |
sessionId | String | 否 | 会话ID过滤(部分匹配) |
响应
响应字段
| 字段 | 说明 |
|---|---|
id | 爬虫信息ID |
sessionId | 会话ID |
name | 会话名称 |
expiredTime | 有效期限(epoch毫秒;以字符串形式返回) |
createdTime | 创建时刻(epoch毫秒;以数值形式返回) |
Note
响应中每个日志对象还包含一个内部字段 crudMode (表示CRUD操作模式的整数值,在读取操作时始终为 0)。 客户端可安全忽略此字段。
获取爬虫信息
请求
响应
删除爬虫信息
请求
响应
批量删除爬虫会话
删除所有爬虫会话(及其参数数据),正在运行的会话除外。不设置任何时间阈值,所有当前未在运行的会话均会被删除。
请求
响应
使用示例
获取爬虫信息列表
按特定会话过滤
获取爬虫信息
删除爬虫信息
批量删除会话
参考信息
Admin API 概述 - Admin API概述
FailureUrl API - 失败URL API
JobLog API - 作业日志API
爬网信息 - 爬虫信息指南