Apercu
Groovy est le langage de script par defaut de Fess. Il fonctionne sur la machine virtuelle Java (JVM) et, tout en etant hautement compatible avec Java, permet d’ecrire des scripts avec une syntaxe plus concise.
Syntaxe de base
Declaration de variables
// Inference de type (def)
def name = "Fess"
def count = 100
// Specification de type explicite
String title = "Document Title"
int pageNum = 1
Manipulation de chaines
// Interpolation de chaines (GString)
def id = 123
def url = "https://example.com/doc/${id}"
// Chaines multi-lignes
def content = """
This is a
multi-line string
"""
// Remplacement
title.replace("old", "new")
title.replaceAll(/\s+/, " ") // Expression reguliere
// Division et jointure
def tags = "tag1,tag2,tag3".split(",")
def joined = tags.join(", ")
// Conversion majuscules/minuscules
title.toUpperCase()
title.toLowerCase()
Operations sur les collections
// Listes
def list = [1, 2, 3, 4, 5]
list.each { println it }
def doubled = list.collect { it * 2 }
def filtered = list.findAll { it > 3 }
// Maps
def map = [name: "Fess", version: "15.5"]
println map.name
println map["version"]
Conditions
// if-else
if (data.status == "active") {
return "Actif"
} else {
return "Inactif"
}
// Operateur ternaire
def result = data.count > 0 ? "Present" : "Absent"
// Operateur Elvis (operateur de coalescence null)
def value = data.title ?: "Sans titre"
// Operateur de navigation securisee
def length = data.content?.length() ?: 0
Boucles
// for-each
for (item in items) {
println item
}
// Closure
items.each { item ->
println item
}
// Plage
(1..10).each { println it }
Scripts de Data Store
Exemples de scripts pour la configuration Data Store.
Mapping de base
url=data.url
title=data.title
content=data.content
lastModified=data.updated_at
Generation d’URL
// Generation d'URL basee sur l'ID
url="https://example.com/article/" + data.id
// Combinaison de plusieurs champs
url="https://example.com/" + data.category + "/" + data.slug + ".html"
// URL conditionnelle
url=data.external_url ?: "https://example.com/default/" + data.id
Traitement du contenu
// Suppression des balises HTML
content=data.html_content.replaceAll(/<[^>]+>/, "")
// Concatenation de plusieurs champs
content=data.title + "\n" + data.description + "\n" + data.body
// Limitation de longueur
content=data.content.length() > 10000 ? data.content.substring(0, 10000) : data.content
Traitement des dates
// Analyse de date
import java.text.SimpleDateFormat
def sdf = new SimpleDateFormat("yyyy-MM-dd'T'HH:mm:ss")
lastModified=sdf.parse(data.date_string)
// Conversion depuis un timestamp Unix
lastModified=new Date(data.timestamp * 1000L)
Scripts de taches planifiees
Exemples de scripts Groovy pour les taches planifiees.
Execution d’un job de crawl
return container.getComponent("crawlJob").execute();
Crawl conditionnel
import java.util.Calendar
def cal = Calendar.getInstance()
def hour = cal.get(Calendar.HOUR_OF_DAY)
// Crawl uniquement en dehors des heures de bureau
if (hour < 9 || hour >= 18) {
return container.getComponent("crawlJob").execute()
}
return "Skipped during business hours"
Execution sequentielle de plusieurs jobs
def results = []
// Optimisation de l'index
results << container.getComponent("optimizeJob").execute()
// Execution du crawl
results << container.getComponent("crawlJob").execute()
return results.join("\n")
Utilisation des classes Java
Dans les scripts Groovy, vous pouvez utiliser les bibliotheques standard Java et les classes Fess.
Date et heure
import java.time.LocalDateTime
import java.time.format.DateTimeFormatter
def now = LocalDateTime.now()
def formatted = now.format(DateTimeFormatter.ISO_LOCAL_DATE_TIME)
Operations sur les fichiers
import java.nio.file.Files
import java.nio.file.Paths
def content = new String(Files.readAllBytes(Paths.get("/path/to/file.txt")))
Communication HTTP
import java.net.URL
def url = new URL("https://api.example.com/data")
def response = url.text
Avertissement
L’acces aux ressources externes affecte les performances, utilisez-le au minimum necessaire.
Acces aux composants Fess
Utilisez container pour acceder aux composants Fess.
System Helper
def systemHelper = container.getComponent("systemHelper")
def currentTime = systemHelper.getCurrentTimeAsLong()
Recuperation des valeurs de configuration
def fessConfig = container.getComponent("fessConfig")
def indexName = fessConfig.getIndexDocumentUpdateIndex()
Execution de recherche
def searchHelper = container.getComponent("searchHelper")
// Configurer les parametres de recherche et executer
Gestion des erreurs
try {
def result = processData(data)
return result
} catch (Exception e) {
import org.apache.logging.log4j.LogManager
def logger = LogManager.getLogger("script")
logger.error("Error processing data: {}", e.message, e)
return "Error: " + e.message
}
Debogage et journalisation
Sortie de logs
import org.apache.logging.log4j.LogManager
def logger = LogManager.getLogger("script")
logger.debug("Debug message: {}", data.id)
logger.info("Processing document: {}", data.title)
logger.warn("Warning: {}", message)
logger.error("Error: {}", e.message)
Sortie de debogage
// Sortie console (developpement uniquement)
println "data.id = ${data.id}"
println "data.title = ${data.title}"
Bonnes pratiques
Garder la simplicite : Eviter les logiques complexes, privilegier un code lisible
Verification de null : Utiliser les operateurs
?.et?:Gestion des exceptions : Gerer les erreurs inattendues avec try-catch approprie
Sortie de logs : Afficher des logs pour faciliter le debogage
Performance : Minimiser les acces aux ressources externes
Informations de reference
Apercu du scripting - Apercu du scripting
Présentation - Guide de configuration Data Store
Planificateur de tâches - Guide de configuration du planificateur