Übersicht der Datenspeicher-Konnektoren

Übersicht

Die Datenspeicher-Konnektoren von Fess bieten die Funktionalität, Inhalte aus anderen Datenquellen als Webseiten oder Dateisystemen abzurufen und zu indizieren.

Mit Datenspeicher-Konnektoren können Sie Daten aus folgenden Quellen durchsuchbar machen:

Cloud-Speicher (Box, Dropbox, Google Drive, OneDrive)
Kollaborationstools (Confluence, Jira, Slack)
Datenbanken (MySQL, PostgreSQL, Oracle usw.)
Andere Systeme (Git, Salesforce, Elasticsearch usw.)

Verfügbare Konnektoren

Fess bietet Konnektoren für verschiedene Datenquellen an. Viele Konnektoren werden als Plugins bereitgestellt und können bei Bedarf installiert werden.

Cloud-Speicher

Konnektor	Plugin	Beschreibung
Box-Konnektor	fess-ds-box	Crawlt Dateien und Ordner von Box.com
Dropbox-Konnektor	fess-ds-dropbox	Crawlt Dateien und Ordner von Dropbox
Google Workspace-Konnektor	fess-ds-gsuite	Crawlt Google Drive
Microsoft 365-Konnektor	fess-ds-microsoft365	Crawlt OneDrive, SharePoint usw.

Kollaborationstools

Konnektor	Plugin	Beschreibung
Atlassian-Konnektor	fess-ds-atlassian	Crawlt Confluence und Jira
Slack-Konnektor	fess-ds-slack	Crawlt Slack-Nachrichten und -Dateien

Entwicklungs- und Betriebstools

Konnektor	Plugin	Beschreibung
Git-Konnektor	fess-ds-git	Crawlt Quellcode aus Git-Repositories
Elasticsearch/OpenSearch-Konnektor	fess-ds-elasticsearch	Ruft Daten von Elasticsearch/OpenSearch ab
Salesforce-Konnektor	fess-ds-salesforce	Crawlt Salesforce-Objekte

Datenbank und Dateien

Konnektor	Plugin	Beschreibung
Datenbank-Konnektor (Datenbank-Suche)	fess-ds-db	Ruft Daten aus JDBC-kompatiblen Datenbanken ab
CSV-Konnektor	fess-ds-csv	Ruft Daten aus CSV-Dateien ab
JSON-Konnektor	fess-ds-json	Ruft Daten aus JSON-Dateien ab

Installation von Konnektoren

Plugin-Installation

Datenspeicher-Konnektor-Plugins können über die Administrationsoberfläche installiert werden.

Über die Administrationsoberfläche

Bei der Administrationsoberfläche anmelden
Zu „System“ → „Plugin“ navigieren
Auf die Schaltfläche „Installieren“ klicken
Das Plugin im Tab „Remote“ auswählen (oder im Tab „Lokal“ eine JAR-Datei hochladen)
Auf „Installieren“ klicken
Fess neu starten

Grundlagen der Datenspeicher-Konfiguration

Die Konfiguration der Datenspeicher-Konnektoren erfolgt in der Administrationsoberfläche unter „Crawler“ -> „Datenspeicher“.

Gemeinsame Einstellungen

Einstellungen, die allen Datenspeicher-Konnektoren gemeinsam sind:

Einstellung	Beschreibung
Name	Identifikationsname der Konfiguration
Handler-Name	Name des zu verwendenden Konnektor-Handlers (z.B. `CsvDataStore`)
Parameter	Konnektor-spezifische Konfigurationsparameter (Schlüssel=Wert-Format)
Skript	Mapping-Skript für Index-Felder
Boost	Priorität in den Suchergebnissen
Berechtigungen	Zugriffsberechtigungen für die gecrawlten Dokumente
Virtuelle Hosts	Virtuelle Hosts, denen diese Konfiguration zugeordnet ist
Beschreibung	Optionale Beschreibung dieser Konfiguration
Sortierreihenfolge	Reihenfolge zur Sortierung der Konfigurationen in der Verwaltungsliste
Aktiviert	Ob diese Konfiguration aktiviert ist

Parameter-Einstellungen

Parameter werden im Format Schlüssel=Wert mit Zeilenumbrüchen als Trennzeichen angegeben:

Skript-Einstellungen

Im Skript werden die abgerufenen Daten auf die Index-Felder von Fess abgebildet. Die linke Seite jeder Zeile ist das Fess-Indexfeld, die rechte Seite das vom Konnektor gelieferte Feld.

Das folgende Beispiel gilt für den CSV-Konnektor mit den Spaltenüberschriften link, subject und body:

Bemerkung

Die im Skript referenzierbaren Feldnamen unterscheiden sich je nach Konnektor. Box/Dropbox/Google Drive/OneDrive referenzieren das abgerufene Objekt über das Präfix file.*; Slack verwendet message.*; Jira verwendet issue.*. CSV-, JSON- und Datenbank-Konnektoren verwenden kein Präfix — die Felder werden direkt referenziert:

CSV: Spaltenüberschriften (bei has_header_line=true), oder cell1, cell2, … (1-basierter Spaltenindex); zusätzlich stehen csvfile und csvfilename zur Verfügung.
JSON: Feldnamen des JSON-Objekts.
Datenbank: Spaltennamen (Aliasse) aus dem SELECT-Ergebnis.

Weitere Details finden Sie in der Dokumentation des jeweiligen Konnektors.

Authentifizierung

Die Authentifizierungsparameter sind konnektorspezifisch. Jeder Konnektor erfordert unterschiedliche Anmeldedaten und Konfigurationsschlüssel. Weitere Informationen finden Sie in der Dokumentation des jeweiligen Konnektors.

Gemeinsame Parameter

Der folgende Parameter wird von AbstractDataStore vererbt und steht in allen Konnektoren zur Verfügung:

Parameter	Standardwert	Beschreibung
`readInterval`	`0`	Wartezeit in Millisekunden zwischen der Verarbeitung einzelner Datensätze. Kann verwendet werden, um die Last auf die Datenquelle zu begrenzen.
`script_type`	`groovy`	Typ der Skript-Engine für das Mapping der Indexfelder. Standardmäßig ist nur `groovy` verfügbar.

Fehlerbehebung

Konnektor wird nicht angezeigt

Überprüfen Sie, ob das Plugin korrekt installiert ist
Starten Sie Fess neu
Prüfen Sie die Logs auf Fehler

Authentifizierungsfehler

Überprüfen Sie die Richtigkeit der Anmeldedaten
Überprüfen Sie die Gültigkeit des Tokens
Überprüfen Sie, ob die erforderlichen Berechtigungen erteilt wurden
Überprüfen Sie, ob der API-Zugriff auf der Service-Seite erlaubt ist

Keine Daten abrufbar

Überprüfen Sie das Format der Parameter
Überprüfen Sie die Zugriffsrechte auf die Ziel-Ordner/Dateien
Überprüfen Sie die Filtereinstellungen
Prüfen Sie detaillierte Fehlermeldungen in den Logs

Debug-Einstellungen

Bei der Untersuchung von Problemen passen Sie das Log-Level an. Das Crawlen von Datenspeichern läuft im Crawler-Prozess, daher muss die Log-Konfigurationsdatei des Crawlers bearbeitet werden:

app/WEB-INF/env/crawler/resources/log4j2.xml:

Weiterführende Informationen

Datenspeicher-Crawl - Leitfaden zur Datenspeicher-Konfiguration
Plug-ins - Leitfaden zur Plugin-Verwaltung
DataConfig API - Datenspeicher-Konfigurations-API