概要
WebConfig APIは、Fess のWebクロール設定を管理するためのAPIです。 クロール対象のURL、クロール深度、除外パターンなどの設定を操作できます。
ベースURL
エンドポイント一覧
| メソッド | パス | 説明 |
|---|---|---|
| GET/PUT | /settings | Webクロール設定一覧取得 |
| GET | /setting/{id} | Webクロール設定取得 |
| POST | /setting | Webクロール設定作成 |
| PUT | /setting | Webクロール設定更新 |
| DELETE | /setting/{id} | Webクロール設定削除 |
Webクロール設定一覧取得
リクエスト
パラメーター
| パラメーター | 型 | 必須 | 説明 |
|---|---|---|---|
size | Integer | いいえ | 1ページあたりの件数(デフォルト: 20) |
page | Integer | いいえ | ページ番号(0から開始) |
レスポンス
Webクロール設定取得
リクエスト
レスポンス
Webクロール設定作成
リクエスト
リクエストボディ
フィールド説明
| フィールド | 必須 | 説明 |
|---|---|---|
name | はい | 設定名 |
urls | はい | クロール開始URL(複数の場合は改行区切り) |
includedUrls | いいえ | クロール対象URLの正規表現パターン |
excludedUrls | いいえ | クロール除外URLの正規表現パターン |
includedDocUrls | いいえ | インデックス対象URLの正規表現パターン |
excludedDocUrls | いいえ | インデックス除外URLの正規表現パターン |
configParameter | いいえ | 追加設定パラメーター |
depth | いいえ | クロール深度(デフォルト: -1=無制限) |
maxAccessCount | いいえ | 最大アクセス数(デフォルト: 100) |
userAgent | いいえ | カスタムUser-Agent |
numOfThread | いいえ | 並列スレッド数(デフォルト: 1) |
intervalTime | いいえ | リクエスト間隔(ミリ秒、デフォルト: 0) |
boost | いいえ | 検索結果のブースト値(デフォルト: 1.0) |
available | いいえ | 有効/無効(デフォルト: true) |
sortOrder | いいえ | 表示順序 |
permissions | いいえ | アクセス許可ロール |
virtualHosts | いいえ | 仮想ホスト |
labelTypeIds | いいえ | ラベルタイプID |
レスポンス
Webクロール設定更新
リクエスト
リクエストボディ
レスポンス
Webクロール設定削除
リクエスト
レスポンス
URLパターンの例
includedUrls / excludedUrls
| パターン | 説明 |
|---|---|
.*example\\.com.* | example.comを含むすべてのURL |
https://example\\.com/docs/.* | /docs/以下のみ |
.*\\.(pdf|doc|docx)$ | PDF、DOC、DOCXファイル |
.*\\?.* | クエリパラメーター付きURL |
.*/(login|logout|admin)/.* | 特定のパスを含むURL |
使用例
企業サイトのクロール設定
ドキュメントサイトのクロール設定
参考情報
Admin API 概要 - Admin API概要
FileConfig API - ファイルクロール設定API
DataConfig API - データストア設定API
ウェブクロール - Webクロール設定ガイド