Apercu
Les connecteurs DataStore de Fess fournissent une fonctionnalite permettant de recuperer et d’indexer du contenu depuis des sources de donnees autres que les sites web ou les systemes de fichiers.
En utilisant les connecteurs DataStore, vous pouvez rendre recherchables les donnees provenant des sources suivantes :
Stockage cloud (Box, Dropbox, Google Drive, OneDrive)
Outils de collaboration (Confluence, Jira, Slack)
Bases de donnees (MySQL, PostgreSQL, Oracle, etc.)
Autres systemes (Git, Salesforce, Elasticsearch, etc.)
Connecteurs disponibles
Fess fournit des connecteurs pour diverses sources de donnees. La plupart des connecteurs sont fournis sous forme de plugins et peuvent etre installes selon les besoins.
Stockage cloud
| Connecteur | Plugin | Description |
|---|---|---|
| Connecteur Box | fess-ds-box | Exploration des fichiers et dossiers Box.com |
| Connecteur Dropbox | fess-ds-dropbox | Exploration des fichiers et dossiers Dropbox |
| Connecteur Google Workspace | fess-ds-gsuite | Exploration de Google Drive |
| Connecteur Microsoft 365 | fess-ds-microsoft365 | Exploration de OneDrive, SharePoint, etc. |
Outils de collaboration
| Connecteur | Plugin | Description |
|---|---|---|
| Connecteur Atlassian | fess-ds-atlassian | Exploration de Confluence et Jira |
| Connecteur Slack | fess-ds-slack | Exploration des messages et fichiers Slack |
Outils de developpement et operations
| Connecteur | Plugin | Description |
|---|---|---|
| Connecteur Git | fess-ds-git | Exploration du code source des depots Git |
| Connecteur Elasticsearch/OpenSearch | fess-ds-elasticsearch | Recuperation de donnees depuis Elasticsearch/OpenSearch |
| Connecteur Salesforce | fess-ds-salesforce | Exploration des objets Salesforce |
Bases de donnees et fichiers
| Connecteur | Plugin | Description |
|---|---|---|
| Connecteur de base de données | fess-ds-db | Recuperation de donnees depuis les bases de donnees compatibles JDBC |
| Connecteur CSV | fess-ds-csv | Recuperation de donnees depuis les fichiers CSV |
| Connecteur JSON | fess-ds-json | Recuperation de donnees depuis les fichiers JSON |
Installation des connecteurs
Installation des plugins
Les plugins de connecteurs DataStore peuvent etre installes depuis l’interface d’administration.
Depuis l’interface d’administration
Connectez-vous a l’interface d’administration
Naviguez vers « Systeme » -> « Plugin »
Cliquez sur le bouton « Installer »
Selectionnez le plugin dans l’onglet « Distant » (ou telechargez un fichier JAR depuis l’onglet « Local »)
Cliquez sur « Installer »
Redemarrez Fess
Configuration de base des DataStores
La configuration des connecteurs DataStore s’effectue dans l’interface d’administration sous « Crawler » -> « DataStore ».
Elements de configuration communs
Elements de configuration communs a tous les connecteurs DataStore :
| Element | Description |
|---|---|
| Nom | Nom d’identification de la configuration |
| Description | Description de la configuration |
| Nom du handler | Nom du handler du connecteur a utiliser (ex: CsvDataStore) |
| Parametres | Parametres de configuration specifiques au connecteur (format key=value) |
| Script | Script de mapping des champs d’index |
| Boost | Priorite dans les resultats de recherche |
| Autorisations | Autorisations d’acces aux documents recuperes par ce connecteur |
| Hotes virtuels | Hote virtuel auquel cette configuration s’applique |
| Ordre d’affichage | Ordre d’affichage dans la liste des configurations |
| Actif | Activer ou non cette configuration |
Configuration des parametres
Les parametres sont specifies au format key=value separes par des retours a la ligne :
Configuration du script
Le script permet de mapper les donnees recuperees vers les champs d’index de Fess. Chaque ligne du script associe un champ d’index Fess (membre gauche) au champ fourni par le connecteur (membre droit).
Voici un exemple pour le connecteur CSV avec les colonnes d’en-tete link, subject et body :
Note
Les noms de champs utilisables dans le script varient selon le connecteur. Box/Dropbox/Google Drive/OneDrive referencent l’objet recupere avec le prefixe file.* ; Slack utilise message.* ; Jira utilise issue.*. En revanche, les connecteurs CSV, JSON et Base de donnees n’utilisent aucun prefixe ; les champs sont references directement :
CSV : noms des colonnes d’en-tete (si
has_header_line=true), oucell1,cell2, … (index base 1) ; ainsi quecsvfileetcsvfilename.JSON : noms des champs de l’objet JSON.
Base de donnees : noms des colonnes (alias) du resultat SELECT.
Consultez la documentation individuelle de chaque connecteur pour plus de details.
Configuration de l’authentification
La plupart des connecteurs DataStore necessitent une authentification (OAuth 2.0, cle API, compte de service, etc.).
Les parametres d’authentification varient selon le connecteur. Consultez la documentation de chaque connecteur pour les details de configuration de l’authentification.
Parametres communs
Parametres communs a tous les connecteurs DataStore :
| Parametre | Defaut | Description |
|---|---|---|
readInterval | 0 | Delai d’attente entre le traitement de chaque enregistrement (en millisecondes). Utilisez ce parametre pour reduire la charge du serveur lors du traitement de grandes quantites de donnees. |
script_type | groovy | Type de moteur de script utilise pour le mappage des champs d’index. Par defaut, seul groovy est disponible. |
Depannage
Le connecteur n’apparait pas
Verifiez que le plugin est correctement installe
Redemarrez Fess
Verifiez les erreurs dans les logs
Erreur d’authentification
Verifiez que les informations d’authentification sont correctes
Verifiez la date d’expiration du token
Verifiez que les autorisations necessaires sont accordees
Verifiez que l’acces API est autorise cote service
Impossible de recuperer les donnees
Verifiez le format des parametres
Verifiez les droits d’acces aux dossiers/fichiers cibles
Verifiez les parametres de filtre
Verifiez les messages d’erreur detailles dans les logs
Configuration de debogage
Pour investiguer les problemes, ajustez le niveau de log. Le crawling des datastores s’execute dans le processus crawler ; c’est donc le fichier de configuration des logs du crawler qu’il faut modifier :
app/WEB-INF/env/crawler/resources/log4j2.xml :
Informations de reference
Présentation - Guide de configuration DataStore
Présentation - Guide de gestion des plugins
API DataConfig - API de configuration DataStore