はじめに
Fess(フェス)は、オープンソースの全文検索サーバーです。 Webサイトやファイルサーバーなどを対象にクロール(巡回)し、収集したコンテンツを横断検索できます。
ここでの説明は素早く Fess に触れてみたい人向けのものです。 Fess を利用するための最小限の手順を記述します。
どちらの方法を使う?
| Docker(推奨) | ZIP パッケージ | |
|---|---|---|
| 事前準備 | Docker と Docker Compose | Java 21、OpenSearch |
| 起動の手軽さ | ◎ コマンド数行のみ | △ 複数ソフトのインストールが必要 |
| こんな人に | まず試してみたい人 | Docker を使えない環境の人 |
Docker を使った起動(推奨)
所要時間の目安:**初回 5〜10 分程度**(Docker イメージのダウンロード時間を含む)
Docker と Docker Compose がインストールされている場合、以下のコマンドで Fess をすぐに起動できます。
1. 設定ファイルのダウンロード
2. コンテナの起動
3. 起動の確認
数分後、以下の URL にアクセスしてください:
検索画面: http://localhost:8080/
管理画面: http://localhost:8080/admin (admin/admin でログイン)
警告
管理者パスワードは必ず変更してください。
4. 停止方法
より詳細な Docker 環境の設定については、Docker インストールガイド を参照してください。
ZIP パッケージを使った起動
所要時間の目安:**初回 20〜30 分程度**(Java・OpenSearch のインストール時間を含む)
Docker を使用しない場合は、以下の手順で ZIP パッケージから起動できます。
ここでの手順はお試し用の起動方法なので、運用向けの構築手順は、インストール手順 などを参照してください。 (この手順で起動したFessは簡単な動作確認用としての利用を想定しており、この環境の運用は推奨していません)
事前準備
Fessを起動する前に、以下のソフトウェアをインストールしておいてください。
1. Java 21 のインストール
Eclipse Temurin の Java 21 を推奨します。
2. OpenSearch のインストールと起動
Fess のデータを保存するために OpenSearch が必要です。 インストール手順 を参照してインストールし、起動しておいてください。
ダウンロード
GitHubのリリースサイト から最新のFessのZIPパッケージをダウンロードします。
インストール
ダウンロードした fess-x.y.z.zip を展開します。
Fess の起動
fess スクリプトを実行して Fess を起動します。 (Windowsの場合は、fess.batを実行してください)
管理 UI にアクセス
http://localhost:8080/admin にアクセスします。 デフォルトの管理者アカウントのユーザー名/パスワードは、admin/admin になります。
警告
デフォルトのパスワードは必ず変更してください。 本番環境では、初回ログイン後すぐにパスワードを変更することを強く推奨します。
Fess の停止(ZIP版)
Ctrl-C や kill コマンド等で fess のプロセスを停止します。
クロール設定と検索
1. クロール設定の作成
ログイン後、左側のメニューの「クローラー」>「ウェブ」をクリックします。 「新規作成」ボタンをクリックして、ウェブクロールの設定情報を作ります。
以下の情報を入力してください:
名前: クロール設定の名前(例:会社のWebサイト)
URL: クロール対象の URL(例:https://www.example.com/)
最大アクセス数: クロールするページ数の上限(初めての場合は
10程度の小さい値を推奨)間隔: クロールの間隔(ミリ秒)(デフォルトの
1000ミリ秒を推奨)
警告
最大アクセス数を大きくしすぎると、対象サイトに過剰な負荷をかける場合があります。 動作確認の際は必ず小さい値(10〜100程度)から始めてください。 自分が管理していないサイトをクロールする場合は、robots.txt の設定に従ってください。
2. クロールの実行
左側のメニューの「システム」>「スケジューラー」をクリックします。 「Default Crawler」ジョブの「今すぐ開始」ボタンをクリックして、即座にクロールを開始できます。
スケジュール実行する場合は、「Default Crawler」を選択して、スケジュールを設定します。 開始時刻が 10:35 am の場合は、35 10 * * ? とします(フォーマットは「分 時 日 月 曜日 年」)。 更新すると、その時間以降にクロールが開始されます。
開始されているかどうかは、「クロール情報」で確認できます。 クロール完了後、セッション情報に WebIndexSize の情報が表示されます。
3. 検索
クロール完了後、http://localhost:8080/ にアクセスし、検索すると検索結果が表示されます。
より詳しく知るには
以下のドキュメントなどを参照してください。