Parte 6: Hub de conocimiento para equipos de desarrollo – Entorno de busqueda integrada de codigo, Wiki y tickets

Introduccion

Los equipos de desarrollo de software utilizan diversas herramientas en su trabajo diario. El codigo se almacena en repositorios Git, las especificaciones en Confluence, las tareas en Jira y la comunicacion cotidiana en Slack. Cada herramienta dispone de su propia funcion de busqueda, pero ante la pregunta «donde fue aquella discusion?», buscar individualmente en cada herramienta resulta ineficiente.

En este articulo, construiremos un hub de conocimiento que centraliza en Fess la informacion de las herramientas que el equipo de desarrollo utiliza a diario, permitiendo realizar busquedas integradas.

Lectores objetivo

Lideres de equipos de desarrollo de software y responsables de infraestructura
Personas que desean realizar busquedas transversales en herramientas de desarrollo
Personas que desean conocer el uso basico de los plugins de data store

Escenario

Habilitaremos la busqueda integrada de la informacion de un equipo de desarrollo (20 personas).

Fuentes de datos objetivo
Herramienta	Uso	Informacion a buscar
Repositorio Git	Gestion de codigo fuente	Codigo, README, archivos de configuracion
Confluence	Gestion de documentos	Documentos de diseno, actas de reuniones, manuales de procedimientos
Jira	Gestion de tickets	Reportes de errores, tareas, historias de usuario
Slack	Comunicacion	Discusiones tecnicas, registros de decisiones

Que es el rastreo de data store

El rastreo web y el rastreo de archivos recopilan documentos siguiendo URLs o rutas de archivos. Por otro lado, para recopilar informacion de herramientas SaaS se utiliza el «rastreo de data store».

El rastreo de data store obtiene datos a traves de la API de cada herramienta y los registra en el indice de Fess. En Fess, se proporcionan plugins de data store para cada herramienta.

Instalacion de plugins

Los plugins de data store se pueden instalar desde el panel de administracion de Fess.

Seleccionar [Sistema] > [Plugins] en el panel de administracion
Verificar la lista de plugins instalados
Ir a la pantalla de instalacion desde el boton [Instalar] e instalar los plugins necesarios desde la pestana [Remoto]

Para el escenario de este articulo, utilizaremos los siguientes plugins.

fess-ds-git: Rastreo de repositorios Git
fess-ds-atlassian: Rastreo de Confluence / Jira
fess-ds-slack: Rastreo de mensajes de Slack

Configuracion de cada fuente de datos

Configuracion de repositorio Git

Rastrearemos repositorios Git para incluir codigo y documentos como objetivos de busqueda.

[Rastreador] > [Data Store] > [Crear nuevo]
Nombre del handler: Seleccionar GitDataStore
Configuracion de parametros

Ejemplo de configuracion de parametros

Ejemplo de configuracion de scripts

En uri se especifica la URL del repositorio, y en username / password las credenciales de autenticacion. Para repositorios privados, se establece un token de acceso en password. Con include_pattern se pueden filtrar las extensiones de archivo objetivo del rastreo mediante expresiones regulares.

Configuracion de Confluence

Incluiremos las paginas y articulos de blog de Confluence como objetivos de busqueda.

[Rastreador] > [Data Store] > [Crear nuevo]
Nombre del handler: Seleccionar ConfluenceDataStore
Configuracion de parametros

Ejemplo de configuracion de parametros

Ejemplo de configuracion de scripts

En home se especifica la URL de Confluence y en auth_type se selecciona el metodo de autenticacion. Para Confluence Cloud se utiliza autenticacion basic, configurando el token de API en basic.password.

Configuracion de Jira

Incluiremos los tickets (Issues) de Jira como objetivos de busqueda.

Se utiliza el handler JiraDataStore incluido en el mismo plugin fess-ds-atlassian. Con JQL (Jira Query Language) se pueden filtrar los tickets objetivo del rastreo. Por ejemplo, es posible limitar el rastreo unicamente a los tickets de un proyecto especifico o solo a aquellos con un estado determinado (excluyendo los cerrados).

[Rastreador] > [Data Store] > [Crear nuevo]
Nombre del handler: Seleccionar JiraDataStore
Configuracion de parametros

Ejemplo de configuracion de parametros

Ejemplo de configuracion de scripts

En issue.jql se especifica la consulta JQL para filtrar los tickets objetivo del rastreo.

Configuracion de Slack

Incluiremos los mensajes de Slack como objetivos de busqueda.

[Rastreador] > [Data Store] > [Crear nuevo]
Nombre del handler: Seleccionar SlackDataStore
Configuracion de parametros

Ejemplo de configuracion de parametros

Ejemplo de configuracion de scripts

En token se especifica el token OAuth del Bot de Slack. Con channels se pueden especificar los canales objetivo del rastreo; para incluir todos los canales se establece *all. Para incluir canales privados se establece include_private=true, y es necesario que el Bot haya sido invitado a dichos canales.

Uso de etiquetas

Distinguir fuentes de informacion con etiquetas

Al configurar etiquetas en cada fuente de datos, se permite alternar entre las fuentes de informacion durante la busqueda.

code: Codigo de repositorios Git
docs: Documentos de Confluence
tickets: Tickets de Jira
discussions: Mensajes de Slack

Los usuarios pueden realizar busquedas transversales con «Todos» y filtrar por etiqueta segun sea necesario.

Mejora de la calidad de busqueda

Uso del impulso de documentos

En un hub de conocimiento para equipos de desarrollo, no todos los documentos tienen la misma importancia. Por ejemplo, se pueden considerar las siguientes prioridades.

Documentos de Confluence (especificaciones formales y manuales de procedimientos)
Tickets de Jira (problemas actuales y tareas en curso)
Repositorios Git (codigo y README)
Mensajes de Slack (registros de discusiones)

Con el impulso de documentos, se puede aumentar la puntuacion de busqueda de los documentos que coincidan con condiciones especificas. Desde [Rastreador] > [Impulso de documentos] en el panel de administracion, se pueden configurar valores de impulso basados en patrones de URL o etiquetas.

Uso de contenido relacionado

Al mostrar «contenido relacionado» en los resultados de busqueda, se ayuda a los usuarios a encontrar la informacion que necesitan. Por ejemplo, al buscar un documento de diseno en Confluence, resulta util que los tickets de Jira relacionados se muestren como «contenido relacionado».

Consideraciones operativas

Programacion del rastreo

Se configura una frecuencia de rastreo apropiada para cada fuente de datos.

Ejemplo de programacion
Fuente de datos	Frecuencia recomendada	Motivo
Confluence	Cada 4 horas	La frecuencia de actualizacion de documentos es moderada
Jira	Cada 2 horas	Las actualizaciones de tickets son frecuentes
Git	Diariamente	Alineado con el ciclo de lanzamiento
Slack	Cada 4 horas	No se requiere tiempo real, pero la frescura es importante

Manejo de limites de tasa de API

Las API de herramientas SaaS tienen limites de tasa. Se deben configurar intervalos de rastreo apropiados para no exceder los limites de tasa de la API. En particular, la API de Slack tiene limites de tasa estrictos, por lo que es importante dejar un margen en los intervalos de rastreo.

Gestion de tokens de acceso

La configuracion de los plugins de data store requiere tokens de acceso a la API de cada herramienta. Desde el punto de vista de la seguridad, tenga en cuenta los siguientes aspectos.

Principio de minimo privilegio: Utilizar tokens de acceso de solo lectura
Rotacion periodica: Actualizar los tokens regularmente
Uso de cuentas dedicadas: Utilizar cuentas de servicio en lugar de cuentas personales

Resumen

En este articulo, construimos un hub de conocimiento que centraliza en Fess la informacion de las herramientas que el equipo de desarrollo utiliza a diario, permitiendo realizar busquedas integradas.

Recopilacion de datos de Git, Confluence, Jira y Slack mediante plugins de data store
Experiencia de busqueda amigable para desarrolladores mediante etiquetas
Control de la prioridad de la informacion con impulso de documentos
Consideraciones operativas como limites de tasa de API y gestion de tokens

Con el hub de conocimiento del equipo de desarrollo, se logra un entorno donde es posible responder rapidamente a preguntas como «donde fue aquella discusion?» o «donde esta esa especificacion?».

En el proximo articulo, abordaremos la busqueda transversal en almacenamiento en la nube.

Parte 6: Hub de conocimiento para equipos de desarrollo – Entorno de busqueda integrada de codigo, Wiki y tickets

Introduccion

Lectores objetivo

Escenario

Que es el rastreo de data store

Instalacion de plugins

Configuracion de cada fuente de datos

Configuracion de repositorio Git

Configuracion de Confluence

Configuracion de Jira

Configuracion de Slack

Uso de etiquetas

Distinguir fuentes de informacion con etiquetas

Mejora de la calidad de busqueda

Uso del impulso de documentos

Uso de contenido relacionado

Consideraciones operativas

Programacion del rastreo

Manejo de limites de tasa de API

Gestion de tokens de acceso

Resumen

Referencias