Übersicht der Datenspeicher-Konnektoren

Übersicht

Die Datenspeicher-Konnektoren von Fess bieten die Funktionalität, Inhalte aus anderen Datenquellen als Webseiten oder Dateisystemen abzurufen und zu indizieren.

Mit Datenspeicher-Konnektoren können Sie Daten aus folgenden Quellen durchsuchbar machen:

  • Cloud-Speicher (Box, Dropbox, Google Drive, OneDrive)

  • Kollaborationstools (Confluence, Jira, Slack)

  • Datenbanken (MySQL, PostgreSQL, Oracle usw.)

  • Andere Systeme (Git, Salesforce, Elasticsearch usw.)

Verfügbare Konnektoren

Fess bietet Konnektoren für verschiedene Datenquellen an. Viele Konnektoren werden als Plugins bereitgestellt und können bei Bedarf installiert werden.

Cloud-Speicher

Konnektor Plugin Beschreibung
Box-Konnektor fess-ds-box Crawlt Dateien und Ordner von Box.com
Dropbox-Konnektor fess-ds-dropbox Crawlt Dateien und Ordner von Dropbox
Google Workspace-Konnektor fess-ds-gsuite Crawlt Google Drive, Gmail usw.
Microsoft 365-Konnektor fess-ds-office365 Crawlt OneDrive, SharePoint usw.

Kollaborationstools

Konnektor Plugin Beschreibung
Atlassian-Konnektor fess-ds-atlassian Crawlt Confluence und Jira
Slack-Konnektor fess-ds-slack Crawlt Slack-Nachrichten und -Dateien

Entwicklungs- und Betriebstools

Konnektor Plugin Beschreibung
Git-Konnektor fess-ds-git Crawlt Quellcode aus Git-Repositories
Elasticsearch/OpenSearch-Konnektor fess-ds-elasticsearch Ruft Daten von Elasticsearch/OpenSearch ab
Salesforce-Konnektor fess-ds-salesforce Crawlt Salesforce-Objekte

Datenbank und Dateien

Konnektor Plugin Beschreibung
Datenbank-Konnektor (integriert) Ruft Daten aus JDBC-kompatiblen Datenbanken ab
CSV-Konnektor fess-ds-csv Ruft Daten aus CSV-Dateien ab
JSON-Konnektor fess-ds-json Ruft Daten aus JSON-Dateien ab

Installation von Konnektoren

Plugin-Installation

Datenspeicher-Konnektor-Plugins können über die Administrationsoberfläche oder den plugin-Befehl installiert werden.

Über die Administrationsoberfläche

  1. Melden Sie sich bei der Administrationsoberfläche an

  2. Navigieren Sie zu „System“ -> „Plugins“

  3. Suchen Sie auf der Registerkarte „Available“ nach dem gewünschten Plugin

  4. Klicken Sie auf „Installieren“

  5. Starten Sie Fess neu

Über die Kommandozeile

# Plugin installieren
./bin/fess-plugin install fess-ds-box

# Installierte Plugins anzeigen
./bin/fess-plugin list

Docker-Umgebung

# Plugins beim Start installieren
docker run -e FESS_PLUGINS="fess-ds-box,fess-ds-dropbox" codelibs/fess:15.5.0

Grundlagen der Datenspeicher-Konfiguration

Die Konfiguration der Datenspeicher-Konnektoren erfolgt in der Administrationsoberfläche unter „Crawler“ -> „Datenspeicher“.

Gemeinsame Einstellungen

Einstellungen, die allen Datenspeicher-Konnektoren gemeinsam sind:

Einstellung Beschreibung
Name Identifikationsname der Konfiguration
Handler-Name Name des zu verwendenden Konnektor-Handlers (z.B. BoxDataStore)
Parameter Konnektor-spezifische Konfigurationsparameter (Schlüssel=Wert-Format)
Skript Mapping-Skript für Index-Felder
Boost Priorität in den Suchergebnissen
Aktiviert Ob diese Konfiguration aktiviert ist

Parameter-Einstellungen

Parameter werden im Format Schlüssel=Wert mit Zeilenumbrüchen als Trennzeichen angegeben:

api.key=xxxxxxxxxxxxx
folder.id=0
max.depth=3

Skript-Einstellungen

Im Skript werden die abgerufenen Daten auf die Index-Felder von Fess abgebildet:

url=data.url
title=data.name
content=data.content
mimetype=data.mimetype
filetype=data.filetype
filename=data.filename
created=data.created
lastModified=data.lastModified
contentLength=data.contentLength

Authentifizierung

Viele Datenspeicher-Konnektoren erfordern OAuth 2.0 oder API-Schlüssel-Authentifizierung.

OAuth 2.0-Authentifizierung

Typische OAuth 2.0-Konfigurationsparameter:

client.id=Client-ID
client.secret=Client-Secret
refresh.token=Refresh-Token

Oder:

access.token=Access-Token

API-Schlüssel-Authentifizierung

api.key=API-Schlüssel
api.secret=API-Secret

Service-Account-Authentifizierung

service.account.email=Service-Account-E-Mail-Adresse
service.account.key=Privater Schlüssel (JSON-Format oder Pfad zur Schlüsseldatei)

Performance-Optimierung

Einstellungen für die Verarbeitung großer Datenmengen:

# Batch-Größe
batch.size=100

# Wartezeit zwischen Anfragen (Millisekunden)
interval=1000

# Anzahl paralleler Threads
thread.size=1

# Timeout (Millisekunden)
timeout=30000

Fehlerbehebung

Konnektor wird nicht angezeigt

  1. Überprüfen Sie, ob das Plugin korrekt installiert ist

  2. Starten Sie Fess neu

  3. Prüfen Sie die Logs auf Fehler

Authentifizierungsfehler

  1. Überprüfen Sie die Richtigkeit der Anmeldedaten

  2. Überprüfen Sie die Gültigkeit des Tokens

  3. Überprüfen Sie, ob die erforderlichen Berechtigungen erteilt wurden

  4. Überprüfen Sie, ob der API-Zugriff auf der Service-Seite erlaubt ist

Keine Daten abrufbar

  1. Überprüfen Sie das Format der Parameter

  2. Überprüfen Sie die Zugriffsrechte auf die Ziel-Ordner/Dateien

  3. Überprüfen Sie die Filtereinstellungen

  4. Prüfen Sie detaillierte Fehlermeldungen in den Logs

Debug-Einstellungen

Bei der Untersuchung von Problemen passen Sie das Log-Level an:

app/WEB-INF/classes/log4j2.xml:

<Logger name="org.codelibs.fess.ds" level="DEBUG"/>

Weiterführende Informationen

  • Datenspeicher-Crawl - Leitfaden zur Datenspeicher-Konfiguration

  • Plug-ins - Leitfaden zur Plugin-Verwaltung

  • ../api/admin/api-admin-dataconfig - Datenspeicher-Konfigurations-API