Vue d’ensemble
L’API FileConfig permet de gérer les configurations de crawl de fichiers de Fess. Vous pouvez manipuler les configurations de crawl pour les systèmes de fichiers locaux, les dossiers partagés SMB/CIFS, FTP et divers stockages objets.
URL de base
Note
Tous les endpoints nécessitent des droits d’administration et un jeton d’accès valide. Consultez Vue d’ensemble de l’API Admin pour les modalités d’authentification.
Liste des endpoints
| Méthode | Chemin | Description |
|---|---|---|
| GET | /settings | Obtention de la liste des configurations de crawl de fichiers |
| GET | /setting/{id} | Obtention d’une configuration de crawl de fichiers |
| POST | /setting | Création d’une configuration de crawl de fichiers |
| PUT | /setting | Mise à jour d’une configuration de crawl de fichiers |
| DELETE | /setting/{id} | Suppression d’une configuration de crawl de fichiers |
Obtention de la liste des configurations de crawl de fichiers
Requête
Note
L’endpoint de liste est accessible à la fois via GET et via PUT.
Paramètres
| Paramètre | Type | Requis | Description |
|---|---|---|---|
page | Integer | Non | Numéro de page (commence à 1, par défaut : 1) |
size | Integer | Non | Nombre d’éléments par page (par défaut : 25, selon le paramètre paging.page.size) |
name | String | Non | Filtrage par nom de configuration |
paths | String | Non | Filtrage par chemin de crawl |
description | String | Non | Filtrage par description |
Réponse
total représente le nombre total de configurations correspondant aux critères de recherche.
Obtention d’une configuration de crawl de fichiers
Requête
Réponse
Note
La réponse inclut les champs d’audit createdBy, createdTime, updatedBy, updatedTime et versionNo, qui sont définis automatiquement lors de la création ou de la mise à jour. versionNo est requis lors de la mise à jour (voir la section « Mise à jour d’une configuration de crawl de fichiers » ci-dessous).
Création d’une configuration de crawl de fichiers
Requête
Corps de la requête
Description des champs
| Champ | Requis | Description |
|---|---|---|
name | Oui | Nom de la configuration (200 caractères maximum) |
description | Non | Description de la configuration (1 000 caractères maximum) |
paths | Oui | Chemins de départ du crawl (séparés par des sauts de ligne si multiples). Indiquez l’un des protocoles suivants : file:, smb:, smb1:, ftp:, storage:, s3:, gcs: |
includedPaths | Non | Expression régulière des chemins à crawler |
excludedPaths | Non | Expression régulière des chemins à exclure du crawl |
includedDocPaths | Non | Expression régulière des chemins à indexer |
excludedDocPaths | Non | Expression régulière des chemins à exclure de l’indexation |
configParameter | Non | Paramètres de configuration supplémentaires (format key=value, un par ligne) |
depth | Non | Profondeur du crawl (0 ou plus) |
maxAccessCount | Non | Nombre maximum d’accès (0 ou plus) |
numOfThread | Oui | Nombre de threads parallèles (1 ou plus) |
intervalTime | Oui | Intervalle entre les accès (en millisecondes, 0 ou plus) |
boost | Oui | Valeur de boost des résultats de recherche |
available | Oui | Activé/Désactivé (chaîne "true" / "false") |
sortOrder | Oui | Ordre d’affichage (0 ou plus) |
permissions | Non | Rôles autorisés (séparés par des sauts de ligne si plusieurs) |
virtualHosts | Non | Hôtes virtuels (séparés par des sauts de ligne si plusieurs) |
Note
Les champs d’audit tels que createdBy, createdTime, updatedBy et updatedTime sont définis automatiquement côté serveur et n’ont pas besoin d’être fournis dans le corps de la requête.
Réponse
Mise à jour d’une configuration de crawl de fichiers
Requête
Corps de la requête
Lors d’une mise à jour, les champs de création sont complétés par id, qui identifie la configuration à mettre à jour, et versionNo, le numéro de version actuel. Indiquez pour versionNo la valeur renvoyée par l’API de récupération (GET).
Champs supplémentaires pour la mise à jour
| Champ | Requis | Description |
|---|---|---|
id | Oui | Identifiant de la configuration à mettre à jour (1 000 caractères maximum) |
versionNo | Oui | Numéro de version actuel de la configuration à mettre à jour. Indiquez la valeur versionNo contenue dans la réponse de l’API de récupération (GET) |
Réponse
Suppression d’une configuration de crawl de fichiers
Requête
Réponse
Format des chemins
Le champ paths accepte les protocoles suivants (la liste des protocoles pris en charge peut être modifiée via le paramètre crawler.file.protocols).
| Protocole | Format du chemin |
|---|---|
| Fichiers locaux | file:///path/to/directory |
| Partage SMB/CIFS | smb://server/share/path |
| Partage SMB/CIFS (SMB1) | smb1://server/share/path |
| FTP | ftp://server/path |
| Stockage objet compatible S3 (MinIO, etc.) | storage://bucket/path |
| Amazon S3 | s3://bucket/path |
| Google Cloud Storage | gcs://bucket/path |
Note
Les informations d’authentification (nom d’utilisateur et mot de passe) pour SMB/CIFS ou FTP ne doivent pas être intégrées dans le chemin. Configurez-les via la fonctionnalité « Authentification de fichier ». Pour plus de détails, consultez Présentation.
Exemples d’utilisation
Configuration de crawl pour des fichiers locaux
Configuration de crawl pour un partage SMB
Note
Si l’accès au partage SMB nécessite une authentification, enregistrez préalablement les informations d’identification de l’hôte cible via la configuration « Authentification de fichier ».
Informations complémentaires
Vue d’ensemble de l’API Admin - Vue d’ensemble de l’API Admin
WebConfig API - API de configuration de crawl Web
API DataConfig - API de configuration datastore
Présentation - Guide de configuration du crawl de fichiers
Présentation - Guide de configuration de l’authentification de fichier