Descripción general
Aquí se explica la configuración relacionada con el mapeo de rutas. El mapeo de rutas es una función que utiliza expresiones regulares para transformar las URLs de los documentos rastreados por Fess. Por ejemplo, se puede utilizar cuando desea rastrear documentos de un servidor de archivos (rutas que comienzan con file://) y hacerlos accesibles a través de un servidor web (http://) desde los resultados de búsqueda.
Método de gestión
Método de visualización
Para abrir la página de lista de configuración de mapeo de rutas que se muestra a continuación, haga clic en [Rastreador > Mapeo de rutas] en el menú izquierdo.

Para editar, haga clic en el nombre de la configuración.
Crear configuración
Para abrir la página de configuración de mapeo de rutas, haga clic en el botón de nueva creación.

Parámetros de configuración
Expresión regular
Especifique la cadena que desea reemplazar. El método de descripción sigue las expresiones regulares de Java.
Reemplazo
Especifique la cadena que reemplazará la expresión regular coincidente.
Tipo de procesamiento
Especifique el momento del reemplazo. Seleccione el tipo apropiado según su propósito.
- Rastreo
Reemplaza la URL después de obtener el documento durante el rastreo, antes de indexar. La URL convertida se guarda en el índice. Utilice esto cuando desee convertir rutas del servidor de archivos a URLs del servidor web y guardarlas en el índice.
- Visualización
Reemplaza la URL antes de mostrar los resultados de búsqueda y al hacer clic en los enlaces de resultados de búsqueda. Las URLs almacenadas en el índice no se modifican. Utilice esto cuando desee mantener la URL original en el índice pero convertirla a una URL diferente solo al mostrar los resultados de búsqueda.
- Rastreo/Visualización
Reemplaza la URL tanto en rastreo como en visualización. Utilice esto cuando desee aplicar la misma conversión en ambos momentos.
- Conversión de URL extraída
Reemplaza las URLs de enlaces al extraer enlaces de documentos HTML. Solo es efectivo con el rastreador web (no es efectivo con el rastreador de archivos). Las URLs guardadas en el índice no se modifican. Utilice esto cuando desee convertir URLs de enlaces extraídas de HTML y agregarlas a la cola de rastreo.
Orden de visualización
Puede especificar el orden de procesamiento del mapeo de rutas. Se procesa en orden ascendente.
Agente de usuario
Especifique esto cuando desee aplicar el mapeo de rutas solo a agentes de usuario específicos. La coincidencia se realiza mediante expresiones regulares. Si no se establece, se aplica a todas las solicitudes.
Eliminar configuración
Haga clic en el nombre de la configuración en la página de lista y haga clic en el botón de eliminar para que aparezca una pantalla de confirmación. Al presionar el botón de eliminar, se eliminará la configuración.
Ejemplos
Acceder al servidor de archivos a través del servidor web
Este es un ejemplo de configuración para rastrear documentos de un servidor de archivos y hacerlos accesibles a través de un servidor web desde los resultados de búsqueda.
| Elemento de configuración | Valor |
|---|---|
| Expresión regular | file:/srv/documents/ |
| Reemplazo | http://fileserver.example.com/documents/ |
| Tipo de procesamiento | Rastreo |
Con esta configuración, las URLs se guardan en el índice como http://fileserver.example.com/documents/....
Convertir URL solo en la visualización
Este es un ejemplo de configuración para mantener la ruta de archivo original en el índice y convertir a una URL del servidor web solo al mostrar los resultados de búsqueda.
| Elemento de configuración | Valor |
|---|---|
| Expresión regular | file:/srv/documents/ |
| Reemplazo | http://fileserver.example.com/documents/ |
| Tipo de procesamiento | Visualización |
Con esta configuración, las URLs se guardan en el índice como file:/srv/documents/... y se convierten a http://... al hacer clic en los resultados de búsqueda.
Conversión de enlaces durante la migración del servidor
Este es un ejemplo de configuración para convertir enlaces en HTML de un servidor antiguo a un servidor nuevo al rastrear un sitio web.
| Elemento de configuración | Valor |
|---|---|
| Expresión regular | http://old-server\\.example\\.com/ |
| Reemplazo | http://new-server.example.com/ |
| Tipo de procesamiento | Conversión de URL extraída |
Con esta configuración, los enlaces extraídos de HTML se convierten y se agregan a la cola de rastreo.
Notas
Sobre la conversión de URL extraída
La conversión de URL extraída solo es efectiva con el rastreador web. No se aplica al rastrear sistemas de archivos. Además, las URLs guardadas en el índice no se modifican; solo se convierten las URLs que se agregan a la cola de rastreo.
Sobre las expresiones regulares
Las expresiones regulares se escriben en formato de expresiones regulares de Java.
Se pueden usar referencias hacia atrás (
$1,$2, etc.)Los caracteres especiales deben escaparse (por ejemplo,
.→\\.)
Sobre el orden de clasificación
Los mapeos de rutas se aplican secuencialmente en el orden de clasificación configurado (ascendente). Cuando coinciden múltiples mapeos de rutas, se aplican comenzando desde la primera coincidencia.