Einleitung
Ein Suchsystem ist ein Werkzeug zum „Finden“ von Informationen, doch die Suchprotokolle selbst sind ebenfalls eine wertvolle Informationsquelle. „Was wird gesucht?“, „Was kann nicht gefunden werden?“, „Welche Informationen werden haeufig aufgerufen?“ – diese Daten dienen als Spiegel, der die Informationsbeduerfnisse und Wissensluecken der Organisation widerspiegelt.
In diesem Artikel kombinieren wir die Suchprotokolle von Fess mit OpenSearch Dashboards, um ein Analyse-Dashboard zu erstellen, das die Wissensnutzung der Organisation visualisiert.
Zielgruppe
Personen, die die Nutzung ihres Suchsystems quantitativ erfassen moechten
Personen, die Daten fuer Strategien zur Informationsnutzung sammeln moechten
Personen, die die grundlegende Bedienung von OpenSearch Dashboards kennenlernen moechten
Der Wert von Suchdaten
Was Suchprotokolle verraten
Suchprotokolle sind eine seltene Art von Daten, die es ermoeglichen, die Informationsbeduerfnisse einer Organisation quantitativ zu erfassen.
Von Fess erfasste Daten
Fess erfasst und speichert automatisch die folgenden Daten.
Suchprotokolle (fess_log.search_log)
Diese koennen in der Administrationsoberflaeche unter [Systeminformationen] > [Suchprotokoll] eingesehen werden. Sie werden im OpenSearch-Index fess_log.search_log gespeichert.
Wichtige Felder:
| Feldname | Typ | Beschreibung |
|---|---|---|
searchWord | keyword | Suchbegriff |
requestedAt | date | Datum und Uhrzeit der Suche |
hitCount | long | Anzahl der Suchergebnisse (0 bedeutet Nulltreffer) |
queryTime | long | Ausfuehrungszeit der Abfrage (Millisekunden) |
responseTime | long | Gesamte Antwortzeit (Millisekunden) |
userAgent | keyword | User-Agent |
clientIp | keyword | Client-IP-Adresse |
accessType | keyword | Zugriffstyp (web, json, gsa, admin usw.) |
queryId | keyword | Abfrage-ID (wird zur Verknuepfung mit Klickprotokollen verwendet) |
Klickprotokolle (fess_log.click_log)
Dies sind Aufzeichnungen darueber, wann Links in Suchergebnissen angeklickt wurden. Sie werden im OpenSearch-Index fess_log.click_log gespeichert.
| Feldname | Typ | Beschreibung |
|---|---|---|
url | keyword | Angeklickte URL |
queryId | keyword | queryId aus dem Suchprotokoll (identifiziert, welche Suche zum Klick fuehrte) |
order | integer | Anzeigeposition in den Suchergebnissen |
requestedAt | date | Datum und Uhrzeit des Klicks |
docId | keyword | Dokument-ID |
Beliebte Woerter
Die auf der Suchoberflaeche angezeigten beliebten Woerter werden aus Suchprotokollen im Suggest-Index von Fess aggregiert. Abfragen, die eine bestimmte Anzahl von Suchtreffern ueberschreiten, werden basierend auf der Suchhaeufigkeit eingestuft.
Visualisierung mit OpenSearch Dashboards
Da die Suchprotokolle von Fess in OpenSearch gespeichert werden, ist eine erweiterte Visualisierung mit OpenSearch Dashboards moeglich.
Einrichtung von OpenSearch Dashboards
Fuegen Sie OpenSearch Dashboards zu Ihrer Docker-Compose-Konfiguration hinzu.
services:
opensearch-dashboards:
image: opensearchproject/opensearch-dashboards:3.6.0
ports:
- "5601:5601"
environment:
OPENSEARCH_HOSTS: '["http://opensearch:9200"]'
DISABLE_SECURITY_DASHBOARDS_PLUGIN: "true"
Greifen Sie auf http://localhost:5601 zu, um die Dashboards-Oberflaeche zu verwenden.
Erstellen von Indexmustern
Um Fess-Protokolldaten in OpenSearch Dashboards zu visualisieren, muessen Sie zunaechst Indexmuster erstellen.
Greifen Sie auf Dashboards zu und waehlen Sie im linken Menue [Stack Management] > [Index Patterns]
Klicken Sie auf [Create index pattern]
Erstellen Sie die folgenden Indexmuster
| Indexmuster | Zeitfeld | Verwendungszweck |
|---|---|---|
fess_log.search_log | requestedAt | Analyse der Suchprotokolle |
fess_log.click_log | requestedAt | Analyse der Klickprotokolle |
Dashboard-Design
Entwerfen Sie das Dashboard mit den folgenden Analyseperspektiven. Erstellen Sie jede Visualisierung ueber [Visualize] im linken Menue und fassen Sie sie in einem [Dashboard] zusammen.
Uebersicht der Suchnutzung
Taegliche Suchanfragen im Zeitverlauf
Verstehen Sie, wie sich die Suchnutzung im Laufe der Zeit veraendert.
Indexmuster:
fess_log.search_logVisualisierung: Line (Liniendiagramm)
X-Achse: Date Histogram (Feld:
requestedAt, Intervall: 1d)Y-Achse: Count
Wenn die Nutzung zunimmt, ist dies ein Beleg dafuer, dass sich das Suchsystem etabliert hat; wenn sie abnimmt, sind Verbesserungen erforderlich.
Suchanfragen nach Tageszeit
Verstehen Sie, zu welchen Tageszeiten die meisten Suchanfragen gestellt werden.
Visualisierung: Vertical Bar (Balkendiagramm)
X-Achse: Date Histogram (Feld:
requestedAt, Intervall: 1h)Y-Achse: Count
Wenn zu Arbeitsbeginn oder nach der Mittagspause vermehrt gesucht wird, zeigt dies, dass die Informationsbeschaffung zu einem festen Bestandteil der taeglichen Arbeit geworden ist.
Analyse der Suchqualitaet
Entwicklung der Nulltrefferrate
Die Nulltrefferrate ist ein wichtiger Indikator fuer die Suchqualitaet. Datensaetze, bei denen das Feld hitCount im Suchprotokoll den Wert 0 hat, entsprechen Nulltreffer-Abfragen.
Indexmuster:
fess_log.search_logFilter:
hitCount: 0hinzufuegen, um Nulltreffer-Abfragen zu extrahierenVisualisierung: Line (Liniendiagramm)
X-Achse: Date Histogram (Feld:
requestedAt, Intervall: 1d)Y-Achse: Count
Wenn die Nulltrefferrate hoch ist, muessen Synonyme hinzugefuegt oder der Crawling-Bereich erweitert werden (siehe Teil 8).
Beachten Sie, dass Sie eine Liste der Nulltreffer-Abfragen auch in der Administrationsoberflaeche unter [Systeminformationen] > [Suchprotokoll] einsehen koennen.
Wortwolke der Nulltreffer-Abfragen
Die Darstellung von Nulltreffer-Abfragen als Wortwolke bietet einen schnellen Ueberblick darueber, welche Informationen fehlen.
Filter:
hitCount: 0Visualisierung: Tag Cloud
Feld: Terms Aggregation (Feld:
searchWord, Groesse: 50)
Analyse des Inhaltswerts
Am haeufigsten angeklickte Suchergebnisse
Haeufig angeklickte Suchergebnisse stellen wertvolle Inhalte fuer die Organisation dar.
Indexmuster:
fess_log.click_logVisualisierung: Data Table
Feld: Terms Aggregation (Feld:
url, Groesse: 20, Sortierung: Count absteigend)
Priorisieren Sie die Pflege und Aktualisierung dieser Inhalte.
Verteilung der Klickpositionen
Ueberpruefen Sie die Verteilung, an welcher Position in den Suchergebnissen geklickt wird.
Indexmuster:
fess_log.click_logVisualisierung: Vertical Bar (Balkendiagramm)
X-Achse: Histogram (Feld:
order, Intervall: 1)Y-Achse: Count
Wenn die Positionen 1-3 die meisten Klicks erhalten, ist die Suchqualitaet gut; wenn Position 10 und hoeher viele Klicks erhalten, sind Ranking-Verbesserungen erforderlich.
Trendanalyse der Informationsbeduerfnisse
Ranking beliebter Suchbegriffe
Verstehen Sie, wofuer sich die Organisation insgesamt interessiert.
Indexmuster:
fess_log.search_logVisualisierung: Data Table
Feld: Terms Aggregation (Feld:
searchWord, Groesse: 20, Sortierung: Count absteigend)
Veraenderungen bei den beliebten Suchbegriffen spiegeln Veraenderungen der Herausforderungen und Interessen der Organisation wider.
Nutzung der Analyseergebnisse
Die Ergebnisse der Suchdatenanalyse koennen fuer die folgenden Massnahmen genutzt werden.
Content-Strategie
Nulltreffer-Abfragen: Fehlende Inhalte identifizieren und deren Erstellung beauftragen
Beliebte Suchbegriffe: Informationen zu haeufig gesuchten Themen erweitern
Ergebnisse mit niedriger Klickrate: Verbesserung oder Entfernung von Inhalten in Betracht ziehen
Verbesserung der Suchqualitaet
Synonyme hinzufuegen: Synonymkandidaten aus Nulltreffer-Abfragen ermitteln
Key-Match-Konfiguration: Optimale Ergebnisse fuer beliebte Abfragen festlegen
Boost-Anpassung: Rankings basierend auf Klickraten verbessern
IT-Investitionsentscheidungen
Steigende Nutzung: Planung zur Erweiterung der Serverressourcen
Neue Informationsbeduerfnisse: Anbindung zusaetzlicher Datenquellen in Betracht ziehen
Bedarf an KI-Funktionen: Entscheidung ueber die Einfuehrung des KI-Suchmodus (siehe Teil 19)
Erstellen regelmaessiger Berichte
Fassen Sie Analyseergebnisse in regelmaessigen Berichten zusammen und teilen Sie diese mit den Beteiligten.
Beispiel fuer monatliche Berichtspunkte
Zusammenfassung der Suchnutzung (Gesamtanzahl der Suchanfragen, Vergleich zum Vormonat)
Entwicklung der Nulltrefferrate und Verbesserungsstatus
Top 10 der beliebten Suchbegriffe
Neu entdeckte Wissensluecken
Durchgefuehrte Verbesserungsmassnahmen und deren Auswirkungen
Verbesserungsplaene fuer den naechsten Monat
Zusammenfassung
In diesem Artikel haben wir erlaeutert, wie Sie mithilfe von Suchprotokollen die Wissensnutzung in Ihrer Organisation visualisieren koennen.
Erkenntnisse aus Suchprotokollen (Informationsbeduerfnisse, Wissensluecken, Inhaltswert)
Aufbau von Visualisierungs-Dashboards mit OpenSearch Dashboards
Anwendung der Analyseergebnisse auf Content-Strategie, Verbesserung der Suchqualitaet und IT-Investitionen
Kontinuierliche Verbesserung durch regelmaessige Berichte
Suchdaten sind ein wertvolles Gut, um eine „Wissenslandkarte der Organisation“ zu zeichnen. Damit schliesst der Abschnitt zu KI und Suche der naechsten Generation ab. In der naechsten und letzten Folge werden wir eine Gesamtzusammenfassung der Serie praesentieren.