Vue d’ensemble
L’API FailureUrl permet de gerer les URLs en echec de crawl dans Fess. Vous pouvez consulter et supprimer les URLs qui ont genere des erreurs pendant le crawl.
URL de base
Liste des endpoints
| Methode | Chemin | Description |
|---|---|---|
| GET | / | Obtention de la liste des URLs en echec |
| DELETE | /{id} | Suppression d’une URL en echec |
| DELETE | /delete-all | Suppression de toutes les URLs en echec |
Obtention de la liste des URLs en echec
Requete
Parametres
| Parametre | Type | Requis | Description |
|---|---|---|---|
size | Integer | Non | Nombre d’elements par page (par defaut : 20) |
page | Integer | Non | Numero de page (commence a 0) |
errorCountMin | Integer | Non | Filtre par nombre minimum d’erreurs |
configId | String | Non | Filtre par ID de configuration |
Reponse
Champs de la reponse
| Champ | Description |
|---|---|
id | ID de l’URL en echec |
url | URL en echec |
configId | ID de la configuration de crawl |
errorName | Nom de l’erreur |
errorLog | Journal de l’erreur |
errorCount | Nombre d’occurrences de l’erreur |
lastAccessTime | Dernier temps d’acces |
threadName | Nom du thread |
Suppression d’une URL en echec
Requete
Reponse
Suppression de toutes les URLs en echec
Requete
Parametres
| Parametre | Type | Requis | Description |
|---|---|---|---|
configId | String | Non | Supprimer uniquement les URLs en echec de cette configuration |
errorCountMin | Integer | Non | Supprimer uniquement les erreurs avec ce nombre minimum |
Reponse
Types d’erreurs
| Nom de l’erreur | Description |
|---|---|
ConnectException | Erreur de connexion |
HttpStatusException | Erreur de statut HTTP (404, 500, etc.) |
SocketTimeoutException | Erreur de delai d’attente |
UnknownHostException | Erreur de resolution du nom d’hote |
SSLException | Erreur de certificat SSL |
IOException | Erreur d’entree/sortie |
Exemples d’utilisation
Obtention de la liste des URLs en echec
Filtrage par nombre d’erreurs
Obtention des URLs en echec d’une configuration specifique
Suppression d’une URL en echec
Suppression de toutes les URLs en echec
Agregation par type d’erreur
Informations complementaires
Vue d’ensemble de l’API Admin - Vue d’ensemble de l’API Admin
API CrawlingInfo - API des informations de crawl
API JobLog - API des journaux de taches
Présentation - Guide de gestion des URLs en echec