Übersicht
Die Datenspeicher-Konnektoren von Fess bieten die Funktionalität, Inhalte aus anderen Datenquellen als Webseiten oder Dateisystemen abzurufen und zu indizieren.
Mit Datenspeicher-Konnektoren können Sie Daten aus folgenden Quellen durchsuchbar machen:
Cloud-Speicher (Box, Dropbox, Google Drive, OneDrive)
Kollaborationstools (Confluence, Jira, Slack)
Datenbanken (MySQL, PostgreSQL, Oracle usw.)
Andere Systeme (Git, Salesforce, Elasticsearch usw.)
Verfügbare Konnektoren
Fess bietet Konnektoren für verschiedene Datenquellen an. Viele Konnektoren werden als Plugins bereitgestellt und können bei Bedarf installiert werden.
Cloud-Speicher
| Konnektor | Plugin | Beschreibung |
|---|---|---|
| Box-Konnektor | fess-ds-box | Crawlt Dateien und Ordner von Box.com |
| Dropbox-Konnektor | fess-ds-dropbox | Crawlt Dateien und Ordner von Dropbox |
| Google Workspace-Konnektor | fess-ds-gsuite | Crawlt Google Drive |
| Microsoft 365-Konnektor | fess-ds-microsoft365 | Crawlt OneDrive, SharePoint usw. |
Kollaborationstools
| Konnektor | Plugin | Beschreibung |
|---|---|---|
| Atlassian-Konnektor | fess-ds-atlassian | Crawlt Confluence und Jira |
| Slack-Konnektor | fess-ds-slack | Crawlt Slack-Nachrichten und -Dateien |
Entwicklungs- und Betriebstools
| Konnektor | Plugin | Beschreibung |
|---|---|---|
| Git-Konnektor | fess-ds-git | Crawlt Quellcode aus Git-Repositories |
| Elasticsearch/OpenSearch-Konnektor | fess-ds-elasticsearch | Ruft Daten von Elasticsearch/OpenSearch ab |
| Salesforce-Konnektor | fess-ds-salesforce | Crawlt Salesforce-Objekte |
Datenbank und Dateien
| Konnektor | Plugin | Beschreibung |
|---|---|---|
| Datenbank-Konnektor | fess-ds-db | Ruft Daten aus JDBC-kompatiblen Datenbanken ab |
| CSV-Konnektor | fess-ds-csv | Ruft Daten aus CSV-Dateien ab |
| JSON-Konnektor | fess-ds-json | Ruft Daten aus JSON-Dateien ab |
Installation von Konnektoren
Plugin-Installation
Datenspeicher-Konnektor-Plugins können über die Administrationsoberfläche installiert werden.
Über die Administrationsoberfläche
Bei der Administrationsoberfläche anmelden
Zu „System“ → „Plugin“ navigieren
Auf die Schaltfläche „Installieren“ klicken
Das Plugin im Tab „Remote“ auswählen (oder im Tab „Lokal“ eine JAR-Datei hochladen)
Auf „Installieren“ klicken
Fess neu starten
Grundlagen der Datenspeicher-Konfiguration
Die Konfiguration der Datenspeicher-Konnektoren erfolgt in der Administrationsoberfläche unter „Crawler“ -> „Datenspeicher“.
Gemeinsame Einstellungen
Einstellungen, die allen Datenspeicher-Konnektoren gemeinsam sind:
| Einstellung | Beschreibung |
|---|---|
| Name | Identifikationsname der Konfiguration |
| Handler-Name | Name des zu verwendenden Konnektor-Handlers (z.B. CsvDataStore) |
| Parameter | Konnektor-spezifische Konfigurationsparameter (Schlüssel=Wert-Format) |
| Skript | Mapping-Skript für Index-Felder |
| Boost | Priorität in den Suchergebnissen |
| Berechtigungen | Zugriffsberechtigungen für die gecrawlten Dokumente |
| Virtuelle Hosts | Virtuelle Hosts, denen diese Konfiguration zugeordnet ist |
| Beschreibung | Optionale Beschreibung dieser Konfiguration |
| Sortierreihenfolge | Reihenfolge zur Sortierung der Konfigurationen in der Verwaltungsliste |
| Aktiviert | Ob diese Konfiguration aktiviert ist |
Parameter-Einstellungen
Parameter werden im Format Schlüssel=Wert mit Zeilenumbrüchen als Trennzeichen angegeben:
Skript-Einstellungen
Im Skript werden die abgerufenen Daten auf die Index-Felder von Fess abgebildet. Die linke Seite jeder Zeile ist das Fess-Indexfeld, die rechte Seite das vom Konnektor gelieferte Feld.
Das folgende Beispiel gilt für den CSV-Konnektor mit den Spaltenüberschriften link, subject und body:
Bemerkung
Die im Skript referenzierbaren Feldnamen unterscheiden sich je nach Konnektor. Box/Dropbox/Google Drive/OneDrive referenzieren das abgerufene Objekt über das Präfix file.*; Slack verwendet message.*; Jira verwendet issue.*. CSV-, JSON- und Datenbank-Konnektoren verwenden kein Präfix — die Felder werden direkt referenziert:
CSV: Spaltenüberschriften (bei
has_header_line=true), odercell1,cell2, … (1-basierter Spaltenindex); zusätzlich stehencsvfileundcsvfilenamezur Verfügung.JSON: Feldnamen des JSON-Objekts.
Datenbank: Spaltennamen (Aliasse) aus dem SELECT-Ergebnis.
Weitere Details finden Sie in der Dokumentation des jeweiligen Konnektors.
Authentifizierung
Die Authentifizierungsparameter sind konnektorspezifisch. Jeder Konnektor erfordert unterschiedliche Anmeldedaten und Konfigurationsschlüssel. Weitere Informationen finden Sie in der Dokumentation des jeweiligen Konnektors.
Gemeinsame Parameter
Der folgende Parameter wird von AbstractDataStore vererbt und steht in allen Konnektoren zur Verfügung:
| Parameter | Standardwert | Beschreibung |
|---|---|---|
readInterval | 0 | Wartezeit in Millisekunden zwischen der Verarbeitung einzelner Datensätze. Kann verwendet werden, um die Last auf die Datenquelle zu begrenzen. |
script_type | groovy | Typ der Skript-Engine für das Mapping der Indexfelder. Standardmäßig ist nur groovy verfügbar. |
Fehlerbehebung
Konnektor wird nicht angezeigt
Überprüfen Sie, ob das Plugin korrekt installiert ist
Starten Sie Fess neu
Prüfen Sie die Logs auf Fehler
Authentifizierungsfehler
Überprüfen Sie die Richtigkeit der Anmeldedaten
Überprüfen Sie die Gültigkeit des Tokens
Überprüfen Sie, ob die erforderlichen Berechtigungen erteilt wurden
Überprüfen Sie, ob der API-Zugriff auf der Service-Seite erlaubt ist
Keine Daten abrufbar
Überprüfen Sie das Format der Parameter
Überprüfen Sie die Zugriffsrechte auf die Ziel-Ordner/Dateien
Überprüfen Sie die Filtereinstellungen
Prüfen Sie detaillierte Fehlermeldungen in den Logs
Debug-Einstellungen
Bei der Untersuchung von Problemen passen Sie das Log-Level an. Das Crawlen von Datenspeichern läuft im Crawler-Prozess, daher muss die Log-Konfigurationsdatei des Crawlers bearbeitet werden:
app/WEB-INF/env/crawler/resources/log4j2.xml:
Weiterführende Informationen
Datenspeicher-Crawl - Leitfaden zur Datenspeicher-Konfiguration
Plug-ins - Leitfaden zur Plugin-Verwaltung
DataConfig API - Datenspeicher-Konfigurations-API