Apercu des connecteurs DataStore

Apercu

Les connecteurs DataStore de Fess fournissent une fonctionnalite permettant de recuperer et d’indexer du contenu depuis des sources de donnees autres que les sites web ou les systemes de fichiers.

En utilisant les connecteurs DataStore, vous pouvez rendre recherchables les donnees provenant des sources suivantes :

  • Stockage cloud (Box, Dropbox, Google Drive, OneDrive)

  • Outils de collaboration (Confluence, Jira, Slack)

  • Bases de donnees (MySQL, PostgreSQL, Oracle, etc.)

  • Autres systemes (Git, Salesforce, Elasticsearch, etc.)

Connecteurs disponibles

Fess fournit des connecteurs pour diverses sources de donnees. La plupart des connecteurs sont fournis sous forme de plugins et peuvent etre installes selon les besoins.

Stockage cloud

Connecteur Plugin Description
Connecteur Box fess-ds-box Exploration des fichiers et dossiers Box.com
Connecteur Dropbox fess-ds-dropbox Exploration des fichiers et dossiers Dropbox
Connecteur Google Workspace fess-ds-gsuite Exploration de Google Drive, Gmail, etc.
Connecteur Microsoft 365 fess-ds-office365 Exploration de OneDrive, SharePoint, etc.

Outils de collaboration

Connecteur Plugin Description
Connecteur Atlassian fess-ds-atlassian Exploration de Confluence et Jira
Connecteur Slack fess-ds-slack Exploration des messages et fichiers Slack

Outils de developpement et operations

Connecteur Plugin Description
Connecteur Git fess-ds-git Exploration du code source des depots Git
Connecteur Elasticsearch/OpenSearch fess-ds-elasticsearch Recuperation de donnees depuis Elasticsearch/OpenSearch
Connecteur Salesforce fess-ds-salesforce Exploration des objets Salesforce

Bases de donnees et fichiers

Connecteur Plugin Description
Connecteur base de donnees (integre) Recuperation de donnees depuis les bases de donnees compatibles JDBC
Connecteur CSV fess-ds-csv Recuperation de donnees depuis les fichiers CSV
Connecteur JSON fess-ds-json Recuperation de donnees depuis les fichiers JSON

Installation des connecteurs

Installation des plugins

Les plugins de connecteurs DataStore peuvent etre installes depuis l’interface d’administration ou via la commande plugin.

Depuis l’interface d’administration

  1. Connectez-vous a l’interface d’administration

  2. Naviguez vers « Systeme » -> « Plugins »

  3. Dans l’onglet « Disponibles », recherchez le plugin souhaite

  4. Cliquez sur « Installer »

  5. Redemarrez Fess

Ligne de commande

# Installer un plugin
./bin/fess-plugin install fess-ds-box

# Verifier les plugins installes
./bin/fess-plugin list

Environnement Docker

# Installer des plugins au demarrage
docker run -e FESS_PLUGINS="fess-ds-box,fess-ds-dropbox" codelibs/fess:15.5.0

Configuration de base des DataStores

La configuration des connecteurs DataStore s’effectue dans l’interface d’administration sous « Crawler » -> « DataStore ».

Elements de configuration communs

Elements de configuration communs a tous les connecteurs DataStore :

Element Description
Nom Nom d’identification de la configuration
Nom du handler Nom du handler du connecteur a utiliser (ex: BoxDataStore)
Parametres Parametres de configuration specifiques au connecteur (format key=value)
Script Script de mapping des champs d’index
Boost Priorite dans les resultats de recherche
Actif Activer ou non cette configuration

Configuration des parametres

Les parametres sont specifies au format key=value separes par des retours a la ligne :

api.key=xxxxxxxxxxxxx
folder.id=0
max.depth=3

Configuration du script

Le script permet de mapper les donnees recuperees vers les champs d’index de Fess :

url=data.url
title=data.name
content=data.content
mimetype=data.mimetype
filetype=data.filetype
filename=data.filename
created=data.created
lastModified=data.lastModified
contentLength=data.contentLength

Configuration de l’authentification

La plupart des connecteurs DataStore necessitent une authentification OAuth 2.0 ou par cle API.

Authentification OAuth 2.0

Parametres de configuration OAuth 2.0 courants :

client.id=ID client
client.secret=Secret client
refresh.token=Token de rafraichissement

Ou :

access.token=Token d'acces

Authentification par cle API

api.key=Cle API
api.secret=Secret API

Authentification par compte de service

service.account.email=Adresse email du compte de service
service.account.key=Cle privee (format JSON ou chemin du fichier de cle)

Optimisation des performances

Configuration pour le traitement de grandes quantites de donnees :

# Taille du lot
batch.size=100

# Delai entre les requetes (millisecondes)
interval=1000

# Nombre de threads paralleles
thread.size=1

# Timeout (millisecondes)
timeout=30000

Depannage

Le connecteur n’apparait pas

  1. Verifiez que le plugin est correctement installe

  2. Redemarrez Fess

  3. Verifiez les erreurs dans les logs

Erreur d’authentification

  1. Verifiez que les informations d’authentification sont correctes

  2. Verifiez la date d’expiration du token

  3. Verifiez que les autorisations necessaires sont accordees

  4. Verifiez que l’acces API est autorise cote service

Impossible de recuperer les donnees

  1. Verifiez le format des parametres

  2. Verifiez les droits d’acces aux dossiers/fichiers cibles

  3. Verifiez les parametres de filtre

  4. Verifiez les messages d’erreur detailles dans les logs

Configuration de debogage

Pour investiguer les problemes, ajustez le niveau de log :

app/WEB-INF/classes/log4j2.xml :

<Logger name="org.codelibs.fess.ds" level="DEBUG"/>

Informations de reference

  • Présentation - Guide de configuration DataStore

  • Présentation - Guide de gestion des plugins

  • ../api/admin/api-admin-dataconfig - API de configuration DataStore