ステミング設定

ステミングについて

Fess ではインデックス作成や検索の際、ステミングという処理が行われています。

これは英単語を正規化する処理であり、例えば、recharging や rechargable といった単語は recharg という形に正規化されます。これによって、recharging という語で検索を行った場合でもrechargableという語にヒットし、検索漏れが少なくなることが期待されます。

protwords.txtについて

ステミング処理は基本的にルールベースの処理であるため、意図しない正規化が行われてしまう可能性があります。例えば、Maine(アメリカの州の名前)という語は main に正規化されてしまいます。

このような場合、protwords.txt に Maine を追加することで、ステミング処理の対象から除外できます。