Rastreo Web
Descripción general
La página de configuración de rastreo web configura el rastreo web.
Método de gestión
Método de visualización
Para abrir la página de lista de configuración de rastreo web que se muestra a continuación, haga clic en [Rastreador > Web] en el menú izquierdo.

Para editar, haga clic en el nombre de la configuración.
Crear configuración
Para abrir la página de configuración de rastreo web, haga clic en el botón de creación.

Parámetros de configuración
Nombre
Nombre de la configuración.
URL
URL que será el punto de inicio del rastreo.
URL a rastrear
Las URL que coincidan con la expresión regular (formato Java) especificada en este elemento serán objeto del rastreador de Fess.
URL excluidas del rastreo
Las URL que coincidan con la expresión regular (formato Java) especificada en este elemento no serán objeto del rastreador de Fess.
URL a buscar
Las URL que coincidan con la expresión regular (formato Java) especificada en este elemento serán objeto de búsqueda.
URL excluidas de la búsqueda
Las URL que coincidan con la expresión regular (formato Java) especificada en este elemento no serán objeto de búsqueda.
Parámetros de configuración
Puede especificar información de configuración de rastreo.
Profundidad
Puede especificar la profundidad al seguir enlaces contenidos en documentos rastreados.
Número máximo de accesos
Número de URLs que se indexarán.
Agente de usuario
Nombre del rastreador de Fess.
Número de hilos
Número de hilos de rastreo en esta configuración.
Intervalo
Intervalo de tiempo en cada hilo al rastrear URLs.
Valor de impulso
Peso de los documentos indexados en esta configuración.
Permisos
Especifique el permiso para esta configuración. La forma de especificar permisos es, por ejemplo, para mostrar resultados de búsqueda a usuarios que pertenecen al grupo developer, especifique {group}developer. La especificación por usuario es {user}nombre_usuario, la especificación por rol es {role}nombre_rol, y la especificación por grupo es {group}nombre_grupo.
Host virtual
Especifique el nombre de host del host virtual. Para más detalles, consulte ../config/virtual-host.
Estado
Si está habilitado, el trabajo programado del rastreador predeterminado incluirá esta configuración.
Descripción
Puede ingresar una descripción.
Eliminar configuración
Haga clic en el nombre de la configuración en la página de lista y haga clic en el botón de eliminar para que aparezca una pantalla de confirmación. Al presionar el botón de eliminar, se eliminará la configuración.
Ejemplo
Rastrear fess.codelibs.org
Para crear una configuración de rastreo web que rastree páginas debajo de https://fess.codelibs.org/, use los siguientes valores de configuración.
| Elemento de configuración | Valor de configuración |
|---|---|
| Nombre | Fess |
| URL | https://fess.codelibs.org/ |
| URL a rastrear | https://fess.codelibs.org/.* |
Use los valores predeterminados para los otros valores de configuración.
Rastreo web de sitios con autenticación web
Fess admite el rastreo de autenticación BASIC, autenticación DIGEST y autenticación NTLM. Para obtener más detalles sobre la autenticación web, consulte la página de autenticación web.
Redmine
Para crear una configuración de rastreo web que rastree páginas de Redmine protegidas con contraseña (ej. https://<server>/), use los siguientes valores de configuración.
| Elemento de configuración | Valor de configuración |
|---|---|
| Nombre | Redmine |
| URL | https://<server>/my/page |
| URL a rastrear | https://<server>/.* |
| Parámetros de configuración | client.robotsTxtEnabled=false (Opcional) |
Después de eso, cree la configuración de autenticación web con los siguientes valores de configuración.
| Elemento de configuración | Valor de configuración |
|---|---|
| Esquema | Form |
| Nombre de usuario | (Cuenta para rastreo) |
| Contraseña | (Contraseña para la cuenta) |
| Parámetros | encoding=UTF-8 token_method=GET token_url=https://<server>/login token_pattern=name=»authenticity_token»[^>]+value=»([^»]+)» token_name=authenticity_token login_method=POST login_url=https://<server>/login login_parameters=username=${username}&password=${password} |
| Autenticación web | Redmine |
XWiki
Para crear una configuración de rastreo web que rastree páginas de XWiki (ej. https://<server>/xwiki/), use los siguientes valores de configuración.
| Elemento de configuración | Valor de configuración |
|---|---|
| Nombre | XWiki |
| URL | https://<server>/xwiki/bin/view/Main/ |
| URL a rastrear | https://<server>/.* |
| Parámetros de configuración | client.robotsTxtEnabled=false (Opcional) |
Después de eso, cree la configuración de autenticación web con los siguientes valores de configuración.
| Elemento de configuración | Valor de configuración |
|---|---|
| Esquema | Form |
| Nombre de usuario | (Cuenta para rastreo) |
| Contraseña | (Contraseña para la cuenta) |
| Parámetros | encoding=UTF-8 token_method=GET token_url=http://<server>/xwiki/bin/login/XWiki/XWikiLogin token_pattern=name=»form_token» +value=»([^»]+)» token_name=form_token login_method=POST login_url=http://<server>/xwiki/bin/loginsubmit/XWiki/XWikiLogin login_parameters=j_username=${username}&j_password=${password} |
| Autenticación web | XWiki |