Descripcion General
El conector de Dropbox proporciona funcionalidad para obtener archivos del almacenamiento en la nube Dropbox y registrarlos en el indice de Fess.
Esta funcionalidad requiere el plugin fess-ds-dropbox.
Servicios Compatibles
Dropbox (almacenamiento de archivos)
Dropbox Paper (documentos)
Requisitos Previos
Se requiere instalacion del plugin
Se requiere una cuenta de desarrollador de Dropbox y la creacion de una aplicacion
Se requiere obtener un token de acceso
Instalacion del Plugin
Instale desde la consola de administracion en «Sistema» -> «Plugins»:
Descargue
fess-ds-dropbox-X.X.X.jarde Maven CentralCargue e instale desde la pantalla de administracion de plugins
Reinicie Fess
O consulte Complemento para mas detalles.
Metodo de Configuracion
Configure desde la consola de administracion en «Rastreador» -> «Almacen de Datos» -> «Crear Nuevo».
Configuracion Basica
| Elemento | Ejemplo de Configuracion |
|---|---|
| Nombre | Company Dropbox |
| Nombre del Manejador | DropboxDataStore o DropboxPaperDataStore |
| Habilitado | Activado |
Configuracion de Parametros
Lista de Parametros
| Parametro | Requerido | Descripcion |
|---|---|---|
access_token | Si | Token de acceso de Dropbox (generado en App Console) |
basic_plan | No | true para cuenta individual, false para cuenta de equipo (predeterminado: false) |
max_size | No | Tamano maximo de archivo para indexacion en bytes (predeterminado: 10000000) |
number_of_threads | No | Numero de hilos para rastreo (predeterminado: 1) |
ignore_folder | No | Indica si se omiten los metadatos de carpetas (predeterminado: true) |
ignore_error | No | Indica si se ignoran los errores durante la extraccion de contenido (predeterminado: true) |
supported_mimetypes | No | Patrones regex para tipos MIME permitidos, separados por comas (predeterminado: .*) |
include_pattern | No | Patron de URL a incluir en el rastreo |
exclude_pattern | No | Patron de URL a excluir del rastreo |
default_permissions | No | Permisos predeterminados para documentos indexados, separados por comas |
max_cached_content_size | No | Tamano maximo de contenido almacenado en cache en memoria en bytes. El contenido que supere este limite se escribe en un archivo temporal (predeterminado: 1048576) |
readInterval | No | Tiempo de espera en milisegundos entre el procesamiento de cada registro (predeterminado: 0) |
Configuracion de Script
Para Archivos de Dropbox
Campos disponibles:
| Campo | Descripcion |
|---|---|
file.url | Enlace de vista previa del archivo |
file.contents | Contenido de texto del archivo |
file.mimetype | Tipo MIME del archivo |
file.filetype | Tipo de archivo |
file.name | Nombre del archivo |
file.path_display | Ruta del archivo |
file.size | Tamano del archivo (bytes) |
file.client_modified | Fecha de ultima modificacion del lado del cliente |
file.server_modified | Fecha de ultima modificacion del lado del servidor |
file.roles | Permisos de acceso del archivo |
file.id | ID del archivo de Dropbox |
file.path_lower | Ruta del archivo en minusculas |
file.parent_shared_folder_id | ID de la carpeta compartida principal |
file.content_hash | Hash del contenido |
file.rev | Revision del archivo |
Para Dropbox Paper
Campos disponibles:
| Campo | Descripcion |
|---|---|
paper.url | Enlace de vista previa del documento Paper |
paper.contents | Contenido de texto del documento Paper |
paper.mimetype | Tipo MIME |
paper.filetype | Tipo de archivo |
paper.title | Titulo del documento Paper |
paper.owner | Propietario del documento Paper |
paper.roles | Permisos de acceso del documento |
paper.revision | Revision del documento Paper |
Configuracion de Autenticacion de Dropbox
Tipo de Cuenta y Token de Acceso
Este conector alterna entre dos modos de operacion segun el parametro basic_plan. Dado que el tipo de aplicacion y de token de acceso que se debe crear difiere, verifiquelo primero.
| Modo | basic_plan | Descripcion |
|---|---|---|
| Cuenta de equipo (predeterminado) | false | Destinado a cuentas Dropbox Business (equipo). Requiere un token de acceso con permisos de administrador del equipo, y rastrea archivos de los miembros del equipo y carpetas de equipo de forma transversal. |
| Cuenta individual | true | Destinado a cuentas individuales (no de equipo). Utiliza un token de acceso con alcance estandar y rastrea directamente los archivos dentro de esa cuenta. |
Nota
Con la configuracion predeterminada (basic_plan=false), se utilizan las API de administracion de equipos (lista de miembros, acceso a archivos por miembro, carpetas de equipo), por lo que es obligatorio disponer de una cuenta Dropbox Business y un token con permisos de administrador del equipo. Si utiliza una cuenta individual, asegurese de configurar basic_plan=true.
Pasos para Obtener el Token de Acceso
1. Crear una aplicacion en Dropbox App Console
Acceda a https://www.dropbox.com/developers/apps:
Haga clic en «Create app»
Seleccione «Scoped access» para el tipo de API
Seleccione el tipo de acceso (se recomienda «Full Dropbox» para rastrear cuentas de equipo de forma transversal)
Ingrese el nombre de la aplicacion y cree
2. Configuracion de Permisos
En la pestana «Permissions», seleccione los permisos requeridos:
Permisos necesarios para el rastreo de archivos y Paper:
files.metadata.read- Lectura de metadatos de archivosfiles.content.read- Lectura de contenido de archivos y documentos Papersharing.read- Lectura de informacion de uso compartido
Permisos adicionales requeridos para cuentas de equipo (``basic_plan=false``):
members.read- Lectura de la lista de miembros del equipoPermisos de acceso a datos de equipo y espacios de equipo (necesarios para rastrear archivos por miembro y carpetas de equipo)
Nota
En el modo de cuenta de equipo, se accede a cada miembro y carpeta de equipo como administrador del equipo. Habilite los permisos de equipo mencionados en la pestana Permissions y genere un token de administrador del equipo.
3. Generar Token de Acceso
En la pestana «Settings»:
Desplacese hasta la seccion «Generated access token»
Haga clic en el boton «Generate»
Copie el token generado (este token se muestra solo una vez)
Advertencia
Guarde el token de acceso de forma segura. Con este token, es posible acceder a la cuenta de Dropbox.
4. Configurar el Token
Configure el token obtenido en los parametros:
Configuracion para Cuenta Individual
Uso con Cuentas Individuales
Para cuentas individuales (no cuentas de equipo), configure el parametro basic_plan como true:
Cuando es false (predeterminado), opera como cuenta de equipo y rastrea archivos de miembros y carpetas del equipo. Cuando es true, opera como cuenta individual y rastrea archivos directamente de la cuenta.
Ejemplos de Uso
Rastrear Todos los Archivos de Dropbox
Parametros:
Script:
Rastrear Documentos de Dropbox Paper
Parametros:
Script:
Rastrear con Permisos
Parametros:
Script (archivos de Dropbox):
Script (Dropbox Paper):
Rastrear Solo Tipos de Archivo Especificos
Para indexar unicamente tipos MIME especificos, especifique en el parametro supported_mimetypes las expresiones regulares de los tipos MIME permitidos, separadas por comas.
Nota
Los scripts del almacen de datos evaluan cada linea como una expresion independiente con el formato campo=expresion. Por ello, no es posible asignar multiples campos en un bloque if de varias lineas. El filtrado por tipo MIME debe realizarse mediante el parametro supported_mimetypes, no con scripts.
Parametros (solo PDF y archivos Word):
Script:
Solucion de Problemas
Errores de Autenticacion
Sintoma: Invalid access token o 401 Unauthorized
Verifique:
Verifique que el token de acceso se haya copiado correctamente
Verifique que el token no haya expirado (use token de larga duracion)
Verifique que los permisos requeridos esten otorgados en Dropbox App Console
Verifique que la aplicacion no este desactivada
No Se Pueden Obtener Archivos
Sintoma: El rastreo tiene exito pero hay 0 archivos
Verifique:
Verifique que el «Access type» de la aplicacion sea apropiado:
«Full Dropbox»: Puede acceder a todo Dropbox
«App folder»: Solo puede acceder a una carpeta especifica
Verifique que los permisos requeridos esten otorgados:
files.metadata.readfiles.content.readsharing.read
Verifique que existan archivos en la cuenta de Dropbox
Errores de Limite de Tasa de API
Sintoma: Error 429 Too Many Requests
Solucion:
Configure
readIntervalpara aumentar el intervalo de procesamiento entre archivosReduzca
number_of_threadspara disminuir el numero de solicitudes simultaneasDivida el almacen de datos en varios (por carpeta u otro criterio) y escalone los horarios de ejecucion
Nota
basic_plan es un parametro que alterna el tipo de cuenta (equipo/individual) y no afecta al ajuste de los limites de tasa. Configurelo correctamente segun su cuenta.
No Se Pueden Obtener Documentos Paper
Sintoma: Los documentos Paper no se rastrean
Verifique:
Verifique que el nombre del manejador sea
DropboxPaperDataStoreVerifique que se incluya el permiso
files.content.readVerifique que realmente existan documentos Paper
Cuando Hay un Gran Numero de Archivos
Sintoma: El rastreo toma mucho tiempo o se agota el tiempo
Solucion:
Divida los almacenes de datos en multiples (por unidad de carpeta, etc.)
Distribuya la carga con configuracion de programacion
En el plan Basic, tenga en cuenta los limites de tasa de API
Permisos y Control de Acceso
Reflejar Permisos de Uso Compartido de Dropbox
Puede reflejar la configuracion de uso compartido de Dropbox en los permisos de Fess:
Parametros:
Script:
file.roles o paper.roles contienen informacion de uso compartido de Dropbox.
Informacion de Referencia
Descripcion General de los Conectores de Almacen de Datos - Descripcion General de Conectores de Almacen de Datos
Conector de Box - Conector de Box
Conector de Google Workspace - Conector de Google Workspace
Rastreo de Almacén de Datos - Guia de Configuracion de Almacen de Datos