Descripcion General de los Conectores de Almacen de Datos

Descripcion General

Los conectores de almacen de datos de Fess proporcionan funcionalidad para obtener contenido de fuentes de datos distintas a sitios web o sistemas de archivos y indexarlo.

Al utilizar conectores de almacen de datos, puede hacer que los datos de las siguientes fuentes sean buscables:

  • Almacenamiento en la nube (Box, Dropbox, Google Drive, OneDrive)

  • Herramientas de colaboracion (Confluence, Jira, Slack)

  • Bases de datos (MySQL, PostgreSQL, Oracle, etc.)

  • Otros sistemas (Git, Salesforce, Elasticsearch, etc.)

Conectores Disponibles

Fess proporciona conectores para diversas fuentes de datos. Muchos conectores se proporcionan como plugins y pueden instalarse segun sea necesario.

Almacenamiento en la Nube

Conector Plugin Descripcion
Conector de Box fess-ds-box Rastrea archivos y carpetas de Box.com
Conector de Dropbox fess-ds-dropbox Rastrea archivos y carpetas de Dropbox
Conector de Google Workspace fess-ds-gsuite Rastrea Google Drive, Gmail, etc.
Conector de Microsoft 365 fess-ds-microsoft365 Rastrea OneDrive, SharePoint, etc.

Herramientas de Colaboracion

Conector Plugin Descripcion
Conector de Atlassian fess-ds-atlassian Rastrea Confluence y Jira
Conector de Slack fess-ds-slack Rastrea mensajes y archivos de Slack

Herramientas de Desarrollo y Operaciones

Conector Plugin Descripcion
Conector Git fess-ds-git Rastrea codigo fuente de repositorios Git
Conector Elasticsearch/OpenSearch fess-ds-elasticsearch Obtiene datos de Elasticsearch/OpenSearch
Conector Salesforce fess-ds-salesforce Rastrea objetos de Salesforce

Bases de Datos y Archivos

Conector Plugin Descripcion
Conector de Base de Datos fess-ds-db Obtiene datos de bases de datos compatibles con JDBC
Conector CSV fess-ds-csv Obtiene datos de archivos CSV
Conector JSON fess-ds-json Obtiene datos de archivos JSON

Instalacion de Conectores

Instalacion de Plugins

Los plugins de conectores de almacen de datos pueden instalarse desde la consola de administracion.

Desde la Consola de Administracion

  1. Inicie sesion en la consola de administracion

  2. Navegue a «Sistema» -> «Plugins»

  3. Busque el plugin deseado en la pestana «Disponible»

  4. Haga clic en «Instalar»

  5. Reinicie Fess

Conceptos Basicos de Configuracion del Almacen de Datos

La configuracion de los conectores de almacen de datos se realiza en la consola de administracion bajo «Rastreador» -> «Almacen de Datos».

Elementos de Configuracion Comunes

Elementos de configuracion comunes a todos los conectores de almacen de datos:

Elemento Descripcion
Nombre Nombre identificador de la configuracion
Descripcion Texto descriptivo de la configuracion
Nombre del Manejador Nombre del manejador del conector a utilizar (ej., BoxDataStore)
Parametros Parametros de configuracion especificos del conector (formato key=value)
Script Script de mapeo de campos del indice
Boost Prioridad en los resultados de busqueda
Permisos Permisos de acceso para los documentos obtenidos de este almacen de datos
Hosts virtuales Host virtual al que se aplica esta configuracion
Orden de visualizacion Orden de visualizacion en la lista de configuraciones
Habilitado Si esta configuracion esta activa o no

Configuracion de Parametros

Los parametros se especifican en formato key=value separados por saltos de linea:

api.key=xxxxxxxxxxxxx
folder.id=0
max.depth=3

Configuracion de Script

Los scripts mapean los datos obtenidos a los campos del indice de Fess.

El siguiente es un ejemplo utilizando el prefijo data.* para conectores CSV/JSON:

url=data.url
title=data.name
content=data.content
mimetype=data.mimetype
filetype=data.filetype
filename=data.filename
created=data.created
lastModified=data.lastModified
contentLength=data.contentLength

Nota

El prefijo de los campos en el script varia segun el conector. Por ejemplo, Box/Dropbox/Google Drive/OneDrive utilizan file.*, Slack utiliza message.*, Jira utiliza issue.*. Consulte la documentacion individual de cada conector para mas detalles.

Configuracion de Autenticacion

Muchos conectores de almacen de datos requieren autenticacion mediante OAuth 2.0, claves API, cuentas de servicio, etc.

Los parametros de autenticacion varian segun el conector. Consulte la documentacion individual de cada conector para los detalles de configuracion de autenticacion.

Parametros Comunes

Parametros comunes disponibles para todos los conectores de almacen de datos:

Parametro Valor por defecto Descripcion
readInterval 0 Tiempo de espera entre el procesamiento de cada registro (milisegundos). Se utiliza para reducir la carga del servidor al procesar grandes cantidades de datos.

Solucion de Problemas

El Conector No Aparece

  1. Verifique que el plugin este instalado correctamente

  2. Reinicie Fess

  3. Revise los logs en busca de errores

Errores de Autenticacion

  1. Verifique que las credenciales de autenticacion sean correctas

  2. Verifique la fecha de expiracion del token

  3. Confirme que se hayan otorgado los permisos necesarios

  4. Verifique que el acceso a la API este permitido en el servicio

No Se Pueden Obtener Datos

  1. Verifique que el formato de los parametros sea correcto

  2. Verifique los permisos de acceso a las carpetas/archivos de destino

  3. Revise la configuracion de filtros

  4. Revise los logs para mensajes de error detallados

Configuracion de Depuracion

Al investigar problemas, ajuste el nivel de log:

app/WEB-INF/classes/log4j2.xml:

<Logger name="org.codelibs.fess.ds" level="DEBUG"/>

Informacion de Referencia