概述
FailureUrl API是用于管理 Fess 爬虫失败URL的API。 您可以查看和删除在爬虫过程中发生错误的URL。
基础URL
端点列表
| 方法 | 路径 | 说明 |
|---|---|---|
| GET | / | 获取失败URL列表 |
| DELETE | /{id} | 删除失败URL |
| DELETE | /delete-all | 删除所有失败URL |
获取失败URL列表
请求
参数
| 参数 | 类型 | 必需 | 说明 |
|---|---|---|---|
size | Integer | 否 | 每页记录数(默认:20) |
page | Integer | 否 | 页码(从0开始) |
errorCountMin | Integer | 否 | 最小错误次数过滤 |
configId | String | 否 | 配置ID过滤 |
响应
响应字段
| 字段 | 说明 |
|---|---|
id | 失败URL ID |
url | 失败的URL |
configId | 爬虫配置ID |
errorName | 错误名称 |
errorLog | 错误日志 |
errorCount | 错误发生次数 |
lastAccessTime | 最后访问时间 |
threadName | 线程名称 |
删除失败URL
请求
响应
删除所有失败URL
请求
参数
| 参数 | 类型 | 必需 | 说明 |
|---|---|---|---|
configId | String | 否 | 仅删除特定配置ID的失败URL |
errorCountMin | Integer | 否 | 仅删除指定次数以上的错误 |
响应
错误类型
| 错误名称 | 说明 |
|---|---|
ConnectException | 连接错误 |
HttpStatusException | HTTP状态错误(404、500等) |
SocketTimeoutException | 超时错误 |
UnknownHostException | 主机名解析错误 |
SSLException | SSL证书错误 |
IOException | 输入输出错误 |
使用示例
获取失败URL列表
按错误次数过滤
获取特定配置的失败URL
删除失败URL
删除所有失败URL
按错误类型统计
参考信息
Admin API 概述 - Admin API概述
CrawlingInfo API - 爬虫信息API
JobLog API - 任务日志API
故障URL - 失败URL管理指南