Übersicht
Die FailureUrl API dient zur Verwaltung von fehlgeschlagenen Crawl-URLs in Fess. Sie können URLs überprüfen und löschen, bei denen während des Crawlings Fehler aufgetreten sind.
Basis-URL
Endpunktliste
| Methode | Pfad | Beschreibung |
|---|---|---|
| GET | / | Liste der fehlgeschlagenen URLs abrufen |
| DELETE | /{id} | Fehlgeschlagene URL löschen |
| DELETE | /delete-all | Alle fehlgeschlagenen URLs löschen |
Liste der fehlgeschlagenen URLs abrufen
Request
Parameter
| Parameter | Typ | Erforderlich | Beschreibung |
|---|---|---|---|
size | Integer | Nein | Anzahl der Einträge pro Seite (Standard: 20) |
page | Integer | Nein | Seitennummer (beginnt bei 0) |
errorCountMin | Integer | Nein | Mindestanzahl der Fehler zum Filtern |
configId | String | Nein | Konfigurations-ID zum Filtern |
Response
Response-Felder
| Feld | Beschreibung |
|---|---|
id | Fehlgeschlagene URL ID |
url | Die fehlgeschlagene URL |
configId | Crawl-Konfigurations-ID |
errorName | Fehlername |
errorLog | Fehlerprotokoll |
errorCount | Anzahl der aufgetretenen Fehler |
lastAccessTime | Letzte Zugriffszeit |
threadName | Thread-Name |
Fehlgeschlagene URL löschen
Request
Response
Alle fehlgeschlagenen URLs löschen
Request
Parameter
| Parameter | Typ | Erforderlich | Beschreibung |
|---|---|---|---|
configId | String | Nein | Nur fehlgeschlagene URLs einer bestimmten Konfiguration löschen |
errorCountMin | Integer | Nein | Nur URLs mit mindestens der angegebenen Fehleranzahl löschen |
Response
Fehlertypen
| Fehlername | Beschreibung |
|---|---|
ConnectException | Verbindungsfehler |
HttpStatusException | HTTP-Statusfehler (404, 500 usw.) |
SocketTimeoutException | Timeout-Fehler |
UnknownHostException | Host-Auflösungsfehler |
SSLException | SSL-Zertifikatsfehler |
IOException | Ein-/Ausgabefehler |
Verwendungsbeispiele
Liste der fehlgeschlagenen URLs abrufen
Nach Fehleranzahl filtern
Fehlgeschlagene URLs einer bestimmten Konfiguration abrufen
Fehlgeschlagene URL löschen
Alle fehlgeschlagenen URLs löschen
Fehlertypen aggregieren
Referenzinformationen
Admin API Übersicht - Admin API Übersicht
CrawlingInfo API - Crawl-Informationen API
JobLog API - Job-Protokoll API
Fehler-URLs - Fehlgeschlagene URLs Verwaltungsanleitung