Übersicht
Die FileConfig API dient zur Verwaltung der Datei-Crawl-Konfigurationen in Fess. Sie können Crawl-Einstellungen für lokale Dateisysteme, SMB/CIFS-Freigabeordner, FTP und verschiedene Objektspeicherdienste verwalten.
Basis-URL
Bemerkung
Alle Endpunkte erfordern Administratorrechte und ein gültiges Zugriffstoken. Informationen zur Authentifizierung finden Sie unter Admin API Übersicht.
Endpunktliste
| Methode | Pfad | Beschreibung |
|---|---|---|
| GET | /settings | Datei-Crawl-Konfigurationsliste abrufen |
| GET | /setting/{id} | Datei-Crawl-Konfiguration abrufen |
| POST | /setting | Datei-Crawl-Konfiguration erstellen |
| PUT | /setting | Datei-Crawl-Konfiguration aktualisieren |
| DELETE | /setting/{id} | Datei-Crawl-Konfiguration löschen |
Datei-Crawl-Konfigurationsliste abrufen
Request
Bemerkung
Der Listen-Endpunkt ist neben GET auch über PUT erreichbar.
Parameter
| Parameter | Typ | Erforderlich | Beschreibung |
|---|---|---|---|
page | Integer | Nein | Seitennummer (beginnt bei 1, Standard: 1) |
size | Integer | Nein | Anzahl der Einträge pro Seite (Standard: 25; richtet sich nach der Einstellung paging.page.size) |
name | String | Nein | Filterung nach Konfigurationsname |
paths | String | Nein | Filterung nach Crawl-Pfad |
description | String | Nein | Filterung nach Beschreibung |
Response
total gibt die Gesamtanzahl der Konfigurationen an, die den Suchkriterien entsprechen.
Datei-Crawl-Konfiguration abrufen
Request
Response
Bemerkung
Die Response enthält die vom Server automatisch gesetzten Felder createdBy, createdTime, updatedBy, updatedTime und versionNo. versionNo wird bei der Aktualisierung benötigt (siehe „Datei-Crawl-Konfiguration aktualisieren“ weiter unten).
Datei-Crawl-Konfiguration erstellen
Request
Request-Body
Feldbeschreibungen
| Feld | Erforderlich | Beschreibung |
|---|---|---|
name | Ja | Konfigurationsname (max. 200 Zeichen) |
description | Nein | Beschreibung der Konfiguration (max. 1000 Zeichen) |
paths | Ja | Crawl-Startpfade (bei mehreren durch Zeilenumbruch getrennt). Anzugeben mit einem der Protokolle file:, smb:, smb1:, ftp:, storage:, s3: oder gcs: |
includedPaths | Nein | Regex-Muster für zu crawlende Pfade |
excludedPaths | Nein | Regex-Muster für auszuschließende Pfade |
includedDocPaths | Nein | Regex-Muster für zu indexierende Pfade |
excludedDocPaths | Nein | Regex-Muster für vom Index auszuschließende Pfade |
configParameter | Nein | Zusätzliche Konfigurationsparameter (Format key=value, ein Eintrag pro Zeile) |
depth | Nein | Crawl-Tiefe (0 oder größer) |
maxAccessCount | Nein | Maximale Zugriffsanzahl (0 oder größer) |
numOfThread | Ja | Anzahl paralleler Threads (1 oder größer) |
intervalTime | Ja | Zugriffsintervall (Millisekunden, 0 oder größer) |
boost | Ja | Boost-Wert für Suchergebnisse |
available | Ja | Aktiviert/Deaktiviert (Zeichenkette "true" / "false") |
sortOrder | Ja | Anzeigereihenfolge (0 oder größer) |
permissions | Nein | Zugriffsberechtigte Rollen (bei mehreren durch Zeilenumbruch getrennt) |
virtualHosts | Nein | Virtuelle Hosts (bei mehreren durch Zeilenumbruch getrennt) |
Bemerkung
Audit-Felder wie createdBy, createdTime, updatedBy und updatedTime werden serverseitig automatisch gesetzt und müssen nicht im Request-Body angegeben werden.
Response
Datei-Crawl-Konfiguration aktualisieren
Request
Request-Body
Bei der Aktualisierung sind neben den Feldern aus der Erstellung zusätzlich id zur Identifikation der Zielkonfiguration und versionNo als Versionsnummer erforderlich. Für versionNo ist der aktuelle Wert aus der Response der Abruf-API (GET) anzugeben.
Zusätzliche Felder bei der Aktualisierung
| Feld | Erforderlich | Beschreibung |
|---|---|---|
id | Ja | Konfigurations-ID der zu aktualisierenden Konfiguration (max. 1000 Zeichen) |
versionNo | Ja | Aktuelle Versionsnummer der zu aktualisierenden Konfiguration. Anzugeben ist der versionNo-Wert aus der Response der Abruf-API (GET) |
Response
Datei-Crawl-Konfiguration löschen
Request
Response
Pfadformate
Für paths können folgende Protokolle verwendet werden (die unterstützten Protokolle können über die Einstellung crawler.file.protocols geändert werden).
| Protokoll | Pfadformat |
|---|---|
| Lokale Datei | file:///path/to/directory |
| SMB/CIFS-Freigabe | smb://server/share/path |
| SMB/CIFS-Freigabe (SMB1) | smb1://server/share/path |
| FTP | ftp://server/path |
| S3-kompatibler Objektspeicher (z. B. MinIO) | storage://bucket/path |
| Amazon S3 | s3://bucket/path |
| Google Cloud Storage | gcs://bucket/path |
Bemerkung
Anmeldeinformationen (Benutzername und Passwort) für SMB/CIFS oder FTP sollten nicht in den Pfad eingebettet werden. Konfigurieren Sie diese stattdessen in der „Datei-Authentifizierung“-Einstellung. Details finden Sie unter Dateiauthentifizierung.
Verwendungsbeispiele
Crawl-Konfiguration für lokale Dateien
Crawl-Konfiguration für SMB-Freigaben
Bemerkung
Falls für den Zugriff auf die SMB-Freigabe eine Authentifizierung erforderlich ist, registrieren Sie vorab die Anmeldeinformationen für den Ziel-Host in der „Datei-Authentifizierung“-Einstellung.
Referenzinformationen
Admin API Übersicht - Admin API Übersicht
WebConfig API - Web-Crawl-Konfiguration API
DataConfig API - Datenspeicher-Konfiguration API
Datei-Crawl - Datei-Crawl-Konfigurationsanleitung
Dateiauthentifizierung - Datei-Authentifizierungsanleitung