Menu

Datei-Crawl

Übersicht

Auf der Datei-Crawl-Konfigurationsseite können Sie Konfigurationen zum Crawlen von Dateien im Dateisystem oder in freigegebenen Netzwerkordnern verwalten.

Verwaltung

Anzeige

Um die Übersichtsseite für die Datei-Crawl-Konfiguration zu öffnen, klicken Sie im linken Menü auf [Crawler > Dateisystem].

image0

Klicken Sie auf den Konfigurationsnamen, um ihn zu bearbeiten.

Konfiguration erstellen

Um die Datei-Crawl-Konfigurationsseite zu öffnen, klicken Sie auf die Schaltfläche „Neu erstellen“.

image1

Konfigurationsparameter

Name

Der Name der Konfiguration.

Pfad

In diesem Pfad geben Sie an, wo das Crawlen beginnen soll (z. B. file:/ oder smb://).

Zu crawlender Pfad

Pfade, die mit dem regulären Ausdruck (Java-Format) übereinstimmen, der in diesem Element angegeben ist, werden vom Fess Crawler gecrawlt.

Vom Crawlen ausgeschlossener Pfad

Pfade, die mit dem regulären Ausdruck (Java-Format) übereinstimmen, der in diesem Element angegeben ist, werden vom Fess Crawler nicht gecrawlt.

Zu durchsuchender Pfad

Pfade, die mit dem regulären Ausdruck (Java-Format) übereinstimmen, der in diesem Element angegeben ist, werden in die Suche einbezogen.

Von der Suche ausgeschlossener Pfad

Pfade, die mit dem regulären Ausdruck (Java-Format) übereinstimmen, der in diesem Element angegeben ist, werden von der Suche ausgeschlossen.

Konfigurationsparameter

Sie können Crawl-Konfigurationsinformationen angeben.

Tiefe

Geben Sie die Tiefe der zu crawlenden Dateisystemstruktur an.

Maximale Zugriffszahl

Geben Sie die Anzahl der zu indizierenden Pfade an.

Thread-Anzahl

Geben Sie die Anzahl der für diese Konfiguration zu verwendenden Threads an.

Intervall

Geben Sie die Wartezeit an, die jeder Thread nach dem Crawlen eines Pfads wartet.

Boost-Wert

Der Boost-Wert ist die Priorität von Dokumenten, die durch diese Konfiguration indiziert werden.

Berechtigung

Geben Sie die Berechtigung für diese Konfiguration an. Um beispielsweise Suchergebnisse für Benutzer anzuzeigen, die zur Gruppe „developer“ gehören, geben Sie {group}developer an. Für Benutzerebene geben Sie {user}Benutzername an, für Rollenebene {role}Rollenname und für Gruppenebene {group}Gruppenname.

Virtueller Host

Geben Sie den Hostnamen des virtuellen Hosts an. Weitere Details finden Sie unter Virtueller Host im Konfigurationshandbuch.

Status

Wenn diese Konfiguration aktiviert ist, enthält der Standard-Crawler-Job diese Konfiguration beim Crawlen.

Beschreibung

Sie können eine Beschreibung eingeben.

Konfiguration löschen

Klicken Sie auf den Konfigurationsnamen auf der Übersichtsseite und dann auf die Schaltfläche „Löschen“. Es wird ein Bestätigungsbildschirm angezeigt. Klicken Sie auf die Schaltfläche „Löschen“, um die Konfiguration zu löschen.

Beispiele

Lokale Dateien crawlen

Um Dateien unter /home/share zu crawlen, würde die Konfiguration wie folgt aussehen:

Name Wert
Name Freigabeverzeichnis
Pfad file:/home/share

Andere Parameter können mit Standardeinstellungen belassen werden.

Windows-Freigabeordner crawlen

Um Dateien unter \SERVERSharedFolder zu crawlen, würde die Konfiguration wie folgt aussehen:

Name Wert
Name Freigabeordner
Pfad smb://SERVER/SharedFolder/

Wenn für den Zugriff auf den Freigabeordner ein Benutzername/Passwort erforderlich ist, müssen Sie eine Dateiauthentifizierungskonfiguration über [Crawler > Dateiauthentifizierung] im linken Menü erstellen. Die Konfiguration dafür würde wie folgt aussehen:

Name Wert
Hostname SERVER
Schema SAMBA
Benutzername (Bitte eingeben)
Passwort (Bitte eingeben)