概要
FailureUrl APIは、Fess のクロール障害URLを管理するためのAPIです。 クロール中にエラーが発生したURLの一覧取得、個別取得、削除などを操作できます。
ベースURL
エンドポイント一覧
| メソッド | パス | 説明 |
|---|---|---|
| GET | /logs | 障害URL一覧取得 |
| GET | /log/{id} | 障害URL取得 |
| DELETE | /log/{id} | 障害URL削除 |
| DELETE | /all | 全障害URL削除 |
障害URL一覧取得
リクエスト
パラメーター
| パラメーター | 型 | 必須 | 説明 |
|---|---|---|---|
size | Integer | いいえ | 1ページあたりの件数(デフォルト: 20) |
page | Integer | いいえ | ページ番号(1から開始、デフォルト: 1) |
url | String | いいえ | URLフィルター(ワイルドカード * ? 使用可) |
errorCountMin | Integer | いいえ | エラー発生回数の下限フィルター(指定値以上) |
errorCountMax | Integer | いいえ | エラー発生回数の上限フィルター(指定値以下) |
errorName | String | いいえ | エラー名フィルター(格納されている完全修飾クラス名に対するワイルドカード検索。* ? 使用可) |
レスポンス
レスポンスフィールド
| フィールド | 説明 |
|---|---|
id | 障害URL ID |
url | 失敗したURL |
threadName | スレッド名 |
errorName | エラー名(発生した例外の完全修飾クラス名。例: java.net.ConnectException) |
errorLog | エラーログ(例外のメッセージやスタックトレース) |
errorCount | エラー発生回数(数値を表す文字列) |
lastAccessTime | 最終アクセス時刻(エポックミリ秒を表す文字列) |
configId | クロール設定ID |
注釈
レスポンスの各フィールドはすべて文字列(JSON string)として返されます。 errorCount は数値を表す文字列、lastAccessTime はエポックミリ秒を表す文字列です。
障害URL取得
リクエスト
レスポンス
障害URL削除
リクエスト
レスポンス
全障害URL削除
すべての障害URLを削除します。パラメーターはありません。
リクエスト
レスポンス
エラータイプ
errorName には、クロール中に発生した例外の完全修飾クラス名がそのまま格納されます。 固定の列挙値ではなく、発生した例外に応じて任意のクラス名が入ります。 以下は代表的な例です。
| エラー名(例) | 説明 |
|---|---|
java.net.ConnectException | 接続拒否(サーバーに接続できない) |
java.net.UnknownHostException | ホスト名を解決できない(DNSエラー) |
java.net.SocketTimeoutException | 接続または読み取りのタイムアウト |
javax.net.ssl.SSLException | SSL/TLS のハンドシェイクまたは証明書エラー |
java.io.IOException | 入出力エラー |
org.codelibs.fess.exception.ContentNotFoundException | crawler.failure.url.status.codes に設定したHTTPステータスコード(デフォルト: 403, 404, 410)が返されたURL |
org.codelibs.fess.crawler.exception.MaxLengthExceededException | コンテンツが最大長を超過 |
使用例
障害URL一覧の取得
エラー回数でフィルター
エラー名でフィルター
障害URLの取得
障害URLの削除
全障害URLの削除
エラータイプ別の集計
参考情報
Admin API 概要 - Admin API概要
CrawlingInfo API - クロール情報API
JobLog API - ジョブログAPI
障害URL - 障害URL管理ガイド