概要
WebConfig APIは、Fess のWebクロール設定を管理するためのAPIです。 クロール対象のURL、クロール深度、除外パターンなどの設定を操作できます。
ベースURL
注釈
すべてのエンドポイントには管理者権限と有効なアクセストークンが必要です。 認証方法については Admin API 概要 を参照してください。
エンドポイント一覧
| メソッド | パス | 説明 |
|---|---|---|
| GET | /settings | Webクロール設定一覧取得 |
| GET | /setting/{id} | Webクロール設定取得 |
| POST | /setting | Webクロール設定作成 |
| PUT | /setting | Webクロール設定更新 |
| DELETE | /setting/{id} | Webクロール設定削除 |
Webクロール設定一覧取得
リクエスト
注釈
一覧取得エンドポイントは GET に加えて PUT でもアクセスできます。
パラメーター
| パラメーター | 型 | 必須 | 説明 |
|---|---|---|---|
page | Integer | いいえ | ページ番号(1から開始、デフォルト: 1) |
size | Integer | いいえ | 1ページあたりの件数(デフォルト: 25。paging.page.size 設定に従います) |
name | String | いいえ | 設定名による絞り込み |
urls | String | いいえ | クロールURLによる絞り込み |
description | String | いいえ | 説明による絞り込み |
レスポンス
total は条件に一致する設定の総件数を表します。
Webクロール設定取得
リクエスト
レスポンス
注釈
レスポンスには、登録・更新時に自動設定される createdBy 、 createdTime 、 updatedBy 、 updatedTime 、 versionNo が含まれます。 versionNo は更新時に必要です(後述の「Webクロール設定更新」を参照)。
Webクロール設定作成
リクエスト
リクエストボディ
フィールド説明
| フィールド | 必須 | 説明 |
|---|---|---|
name | はい | 設定名(最大200文字) |
description | いいえ | 設定の説明(最大1000文字) |
urls | はい | クロール開始URL(複数の場合は改行区切り)。http: または https: で指定します |
includedUrls | いいえ | クロール対象URLの正規表現パターン |
excludedUrls | いいえ | クロール除外URLの正規表現パターン |
includedDocUrls | いいえ | インデックス対象URLの正規表現パターン |
excludedDocUrls | いいえ | インデックス除外URLの正規表現パターン |
configParameter | いいえ | 追加設定パラメーター(key=value 形式、1行に1項目) |
depth | いいえ | クロール深度(0以上) |
maxAccessCount | いいえ | 最大アクセス数(0以上) |
userAgent | はい | User-Agent文字列(最大200文字) |
numOfThread | はい | 並列スレッド数(1以上) |
intervalTime | はい | アクセス間隔(ミリ秒、0以上) |
boost | はい | 検索結果のブースト値 |
available | はい | 有効/無効(文字列 "true" / "false") |
sortOrder | はい | 表示順序(0以上) |
permissions | いいえ | アクセス許可ロール(複数の場合は改行区切り) |
virtualHosts | いいえ | 仮想ホスト(複数の場合は改行区切り) |
注釈
createdBy 、 createdTime 、 updatedBy 、 updatedTime などの監査用フィールドは サーバー側で自動設定されるため、リクエストボディで指定する必要はありません。
レスポンス
Webクロール設定更新
リクエスト
リクエストボディ
更新時は、作成時のフィールドに加えて、更新対象を特定する id とバージョン番号 versionNo が必須です。 versionNo には取得API(GET)のレスポンスに含まれる現在の値を指定します。
更新時の追加フィールド
| フィールド | 必須 | 説明 |
|---|---|---|
id | はい | 更新対象の設定ID(最大1000文字) |
versionNo | はい | 更新対象の現在のバージョン番号。取得API(GET)のレスポンスに含まれる versionNo を指定します |
レスポンス
Webクロール設定削除
リクエスト
レスポンス
URLパターンの例
includedUrls / excludedUrls / includedDocUrls / excludedDocUrls には正規表現を指定します。
| パターン | 説明 |
|---|---|
.*example\\.com.* | example.comを含むすべてのURL |
https://example\\.com/docs/.* | /docs/以下のみ |
.*\\.(pdf|doc|docx)$ | PDF、DOC、DOCXファイル |
.*\\?.* | クエリパラメーター付きURL |
.*/(login|logout|admin)/.* | 特定のパスを含むURL |
使用例
企業サイトのクロール設定
ドキュメントサイトのクロール設定
参考情報
Admin API 概要 - Admin API概要
FileConfig API - ファイルクロール設定API
DataConfig API - データストア設定API
ウェブクロール - Webクロール設定ガイド