Übersicht
Der CSV-Konnektor bietet die Funktionalität, Daten aus CSV-Dateien abzurufen und im Fess-Index zu registrieren.
Für diese Funktion ist das Plugin fess-ds-csv erforderlich.
Voraussetzungen
Die Installation des Plugins ist erforderlich
Zugriff auf die CSV-Datei ist erforderlich
Die Zeichenkodierung der CSV-Datei muss bekannt sein
Plugin-Installation
Methode 1: JAR-Datei direkt platzieren
Methode 2: Über die Administrationsoberfläche installieren
Öffnen Sie „System“ -> „Plugins“
Laden Sie die JAR-Datei hoch
Starten Sie Fess neu
Konfiguration
Konfigurieren Sie über die Administrationsoberfläche unter „Crawler“ -> „Datenspeicher“ -> „Neu erstellen“.
Grundeinstellungen
| Einstellung | Beispielwert |
|---|---|
| Name | Products CSV |
| Handler-Name | CsvDataStore |
| Aktiviert | Ein |
Parameter-Einstellungen
Lokale Datei:
Mehrere Dateien:
Parameterliste
Skript-Einstellungen
Mit Kopfzeile:
Ohne Kopfzeile (Spaltenindex):
Verfügbare Felder
data.<Spaltenname>- Spaltenname der Kopfzeile (bei has_header_line=true)data.cell<N>- Spaltenindex (bei has_header_line=false, beginnend bei 1:cell1,cell2…)
CSV-Format-Details
Standard-CSV (RFC 4180-konform)
Trennzeichen ändern
Tab-getrennt (TSV):
Semikolon-getrennt:
Benutzerdefinierte Anführungszeichen
Einfache Anführungszeichen:
Zeichenkodierung
Japanische Datei (Shift_JIS):
Deutsche Datei (ISO-8859-1):
Anwendungsbeispiele
Produktkatalog-CSV
CSV-Datei (products.csv):
Parameter:
Skript:
Filterung nach Lagerbestand:
Mitarbeiterverzeichnis-CSV
CSV-Datei (employees.csv):
Parameter:
Skript:
CSV ohne Kopfzeile
CSV-Datei (data.csv):
Parameter:
Skript:
Mehrere CSV-Dateien zusammenführen
Parameter:
Skript:
Tab-getrennte Datei (TSV)
TSV-Datei (data.tsv):
Parameter:
Skript:
Fehlerbehebung
Datei nicht gefunden
Symptom: FileNotFoundException oder No such file
Zu überprüfen:
Überprüfen Sie, ob der Dateipfad korrekt ist (absoluter Pfad empfohlen)
Überprüfen Sie, ob die Datei existiert
Überprüfen Sie die Leseberechtigungen der Datei
Überprüfen Sie, ob der Fess-Ausführungsbenutzer Zugriff hat
Zeichenkodierungsprobleme
Symptom: Umlaute oder Sonderzeichen werden nicht korrekt angezeigt
Lösung:
Geben Sie die richtige Zeichenkodierung an:
Zeichenkodierung der Datei ermitteln:
Spalten werden nicht korrekt erkannt
Symptom: Spaltentrennzeichen wird nicht korrekt erkannt
Zu überprüfen:
Überprüfen Sie, ob das Trennzeichen korrekt ist:
Überprüfen Sie die Anführungszeichen-Einstellung
Überprüfen Sie das CSV-Dateiformat (RFC 4180-konform?)
Kopfzeilen-Behandlung
Symptom: Erste Zeile wird als Daten erkannt
Lösung:
Bei vorhandener Kopfzeile:
Ohne Kopfzeile:
Keine Daten abrufbar
Symptom: Crawling erfolgreich, aber 0 Einträge
Zu überprüfen:
Überprüfen Sie, ob die CSV-Datei nicht leer ist
Überprüfen Sie die Skript-Einstellungen
Überprüfen Sie die Spaltennamen (bei has_header_line=true)
Überprüfen Sie die Logs auf Fehlermeldungen
Große CSV-Dateien
Symptom: Speicherüberlauf oder Timeout
Lösung:
Teilen Sie die CSV-Datei in mehrere auf
Verwenden Sie nur benötigte Spalten im Skript
Erhöhen Sie die Heap-Größe von Fess
Filtern Sie nicht benötigte Zeilen
Felder mit Zeilenumbrüchen
Im RFC 4180-Format können Felder mit Anführungszeichen umschlossen Zeilenumbrüche enthalten:
Parameter:
Erweiterte Skript-Beispiele
Datenverarbeitung
Bedingte Indizierung
Mehrere Spalten kombinieren
Datumsformatierung
Weiterführende Informationen
Übersicht der Datenspeicher-Konnektoren - Übersicht der Datenspeicher-Konnektoren
JSON-Konnektor - JSON-Konnektor
Datenbank-Konnektor - Datenbank-Konnektor
Datenspeicher-Crawl - Leitfaden zur Datenspeicher-Konfiguration