FileConfig API

Vue d’ensemble

L’API FileConfig permet de gérer les configurations de crawl de fichiers de Fess. Vous pouvez manipuler les configurations de crawl pour les systèmes de fichiers locaux, les dossiers partagés SMB/CIFS, FTP et divers stockages objets.

URL de base

Note

Tous les endpoints nécessitent des droits d’administration et un jeton d’accès valide. Consultez Vue d’ensemble de l’API Admin pour les modalités d’authentification.

Liste des endpoints

Méthode	Chemin	Description
GET	/settings	Obtention de la liste des configurations de crawl de fichiers
GET	/setting/{id}	Obtention d’une configuration de crawl de fichiers
POST	/setting	Création d’une configuration de crawl de fichiers
PUT	/setting	Mise à jour d’une configuration de crawl de fichiers
DELETE	/setting/{id}	Suppression d’une configuration de crawl de fichiers

Obtention de la liste des configurations de crawl de fichiers

Requête

Note

L’endpoint de liste est accessible à la fois via GET et via PUT.

Paramètres

Paramètre	Type	Requis	Description
`page`	Integer	Non	Numéro de page (commence à 1, par défaut : 1)
`size`	Integer	Non	Nombre d’éléments par page (par défaut : 25, selon le paramètre `paging.page.size`)
`name`	String	Non	Filtrage par nom de configuration
`paths`	String	Non	Filtrage par chemin de crawl
`description`	String	Non	Filtrage par description

Réponse

{
  "response": {
    "status": 0,
    "settings": [
      {
        "id": "fileconfig_id_1",
        "name": "Shared Documents",
        "description": "Documents partagés",
        "paths": "smb://server/share/documents",
        "includedPaths": ".*\\.pdf$",
        "excludedPaths": ".*/(temp|cache)/.*",
        "includedDocPaths": "",
        "excludedDocPaths": "",
        "configParameter": "",
        "depth": 10,
        "maxAccessCount": 1000,
        "numOfThread": 1,
        "intervalTime": 1000,
        "boost": 1.0,
        "available": "true",
        "permissions": "{role}admin",
        "virtualHosts": "",
        "sortOrder": 0
      }
    ],
    "total": 5
  }
}

total représente le nombre total de configurations correspondant aux critères de recherche.

Obtention d’une configuration de crawl de fichiers

Requête

Réponse

{
  "response": {
    "status": 0,
    "setting": {
      "id": "fileconfig_id_1",
      "name": "Shared Documents",
      "description": "Documents partagés",
      "paths": "smb://server/share/documents",
      "includedPaths": ".*\\.pdf$",
      "excludedPaths": ".*/(temp|cache)/.*",
      "includedDocPaths": "",
      "excludedDocPaths": "",
      "configParameter": "",
      "depth": 10,
      "maxAccessCount": 1000,
      "numOfThread": 1,
      "intervalTime": 1000,
      "boost": 1.0,
      "available": "true",
      "sortOrder": 0,
      "permissions": "{role}admin",
      "virtualHosts": "",
      "createdBy": "admin",
      "createdTime": 1700000000000,
      "updatedBy": "admin",
      "updatedTime": 1700000000000,
      "versionNo": 1
    }
  }
}

Note

La réponse inclut les champs d’audit createdBy, createdTime, updatedBy, updatedTime et versionNo, qui sont définis automatiquement lors de la création ou de la mise à jour. versionNo est requis lors de la mise à jour (voir la section « Mise à jour d’une configuration de crawl de fichiers » ci-dessous).

Création d’une configuration de crawl de fichiers

Requête

Corps de la requête

{
  "name": "Local Files",
  "paths": "file:///data/documents",
  "includedPaths": ".*\\.(pdf|doc|docx|xls|xlsx)$",
  "excludedPaths": ".*/(temp|backup)/.*",
  "numOfThread": 2,
  "intervalTime": 500,
  "boost": 1.0,
  "available": "true",
  "sortOrder": 0,
  "permissions": "{role}admin\n{role}user"
}

Description des champs

Champ	Requis	Description
`name`	Oui	Nom de la configuration (200 caractères maximum)
`description`	Non	Description de la configuration (1 000 caractères maximum)
`paths`	Oui	Chemins de départ du crawl (séparés par des sauts de ligne si multiples). Indiquez l’un des protocoles suivants : `file:`, `smb:`, `smb1:`, `ftp:`, `storage:`, `s3:`, `gcs:`
`includedPaths`	Non	Expression régulière des chemins à crawler
`excludedPaths`	Non	Expression régulière des chemins à exclure du crawl
`includedDocPaths`	Non	Expression régulière des chemins à indexer
`excludedDocPaths`	Non	Expression régulière des chemins à exclure de l’indexation
`configParameter`	Non	Paramètres de configuration supplémentaires (format `key=value`, un par ligne)
`depth`	Non	Profondeur du crawl (0 ou plus)
`maxAccessCount`	Non	Nombre maximum d’accès (0 ou plus)
`numOfThread`	Oui	Nombre de threads parallèles (1 ou plus)
`intervalTime`	Oui	Intervalle entre les accès (en millisecondes, 0 ou plus)
`boost`	Oui	Valeur de boost des résultats de recherche
`available`	Oui	Activé/Désactivé (chaîne `"true"` / `"false"`)
`sortOrder`	Oui	Ordre d’affichage (0 ou plus)
`permissions`	Non	Rôles autorisés (séparés par des sauts de ligne si plusieurs)
`virtualHosts`	Non	Hôtes virtuels (séparés par des sauts de ligne si plusieurs)

Note

Les champs d’audit tels que createdBy, createdTime, updatedBy et updatedTime sont définis automatiquement côté serveur et n’ont pas besoin d’être fournis dans le corps de la requête.

Réponse

Mise à jour d’une configuration de crawl de fichiers

Requête

Corps de la requête

Lors d’une mise à jour, les champs de création sont complétés par id, qui identifie la configuration à mettre à jour, et versionNo, le numéro de version actuel. Indiquez pour versionNo la valeur renvoyée par l’API de récupération (GET).

{
  "id": "existing_fileconfig_id",
  "name": "Updated Local Files",
  "paths": "file:///data/documents",
  "includedPaths": ".*\\.(pdf|doc|docx|xls|xlsx|ppt|pptx)$",
  "excludedPaths": ".*/(temp|backup|archive)/.*",
  "depth": 10,
  "maxAccessCount": 10000,
  "numOfThread": 3,
  "intervalTime": 300,
  "boost": 1.2,
  "available": "true",
  "sortOrder": 0,
  "versionNo": 1
}

Champs supplémentaires pour la mise à jour

Champ	Requis	Description
`id`	Oui	Identifiant de la configuration à mettre à jour (1 000 caractères maximum)
`versionNo`	Oui	Numéro de version actuel de la configuration à mettre à jour. Indiquez la valeur `versionNo` contenue dans la réponse de l’API de récupération (GET)

Réponse

Suppression d’une configuration de crawl de fichiers

Requête

Réponse

Format des chemins

Le champ paths accepte les protocoles suivants (la liste des protocoles pris en charge peut être modifiée via le paramètre crawler.file.protocols).

Protocole	Format du chemin
Fichiers locaux	`file:///path/to/directory`
Partage SMB/CIFS	`smb://server/share/path`
Partage SMB/CIFS (SMB1)	`smb1://server/share/path`
FTP	`ftp://server/path`
Stockage objet compatible S3 (MinIO, etc.)	`storage://bucket/path`
Amazon S3	`s3://bucket/path`
Google Cloud Storage	`gcs://bucket/path`

Note

Les informations d’authentification (nom d’utilisateur et mot de passe) pour SMB/CIFS ou FTP ne doivent pas être intégrées dans le chemin. Configurez-les via la fonctionnalité « Authentification de fichier ». Pour plus de détails, consultez Présentation.

Exemples d’utilisation

Configuration de crawl pour des fichiers locaux

curl -X POST "http://localhost:8080/api/admin/fileconfig/setting" \
     -H "Authorization: Bearer YOUR_TOKEN" \
     -H "Content-Type: application/json" \
     -d '{
       "name": "Local Files",
       "paths": "file:///data/documents",
       "includedPaths": ".*\\.(pdf|doc|docx)$",
       "excludedPaths": ".*/(temp|backup)/.*",
       "numOfThread": 2,
       "intervalTime": 500,
       "boost": 1.0,
       "available": "true",
       "sortOrder": 0,
       "permissions": "{role}guest"
     }'

Configuration de crawl pour un partage SMB

curl -X POST "http://localhost:8080/api/admin/fileconfig/setting" \
     -H "Authorization: Bearer YOUR_TOKEN" \
     -H "Content-Type: application/json" \
     -d '{
       "name": "SMB Share",
       "paths": "smb://server/documents",
       "includedPaths": ".*\\.(pdf|doc|docx)$",
       "excludedPaths": ".*/(temp|private)/.*",
       "maxAccessCount": 50000,
       "numOfThread": 3,
       "intervalTime": 200,
       "boost": 1.0,
       "available": "true",
       "sortOrder": 0,
       "permissions": "{role}guest"
     }'

Note

Si l’accès au partage SMB nécessite une authentification, enregistrez préalablement les informations d’identification de l’hôte cible via la configuration « Authentification de fichier ».

Informations complémentaires

Vue d’ensemble de l’API Admin - Vue d’ensemble de l’API Admin
WebConfig API - API de configuration de crawl Web
API DataConfig - API de configuration datastore
Crawl de système de fichiers (recherche sur serveur de fichiers) - Guide de configuration du crawl de fichiers
Présentation - Guide de configuration de l’authentification de fichier