Summa. Arkitektur og workflow
Summa Arkitektur
Summa er bygget til at kunne håndtere de krav, som brugerne har til søgning. En forudsætning for at systemet er levedygtigt, er en fleksibel og stabil arkitektur, der tillader udvidelser og gnidningsfri administration.
Summa består af et sæt af uafhængige moduler, der kommunikerer gennem testede
entrepriseprotokoller
som JINI, RMI og SOAP-webservices. Alle moduler er udviklet i Java 5 og
J2EE 1.4 og inkluderer entreprisemonitorering og administration via JSR-3(JMX).
Summa kan derfor administreres gennem standardadministrations- og overvågningspakker såsom IBM-Tivoli.
Summa er designet til at kunne håndtere vilkårligt store mængder data,
hvor hvert modul kan sættes op i klynger, der er uafhængige af hinanden.
Summa workflow
Workflowet i Summa er indrettet til at være let at udvide på tre grundlæggende trin i forhold til at skabe den bedst mulige søgbarhed overfor brugerne.
I metadata-ingest-fasen kan man opsætte en vilkårligt kompleks filter-chain med det formål, at metadataposter først normaliseres og siden beriges på postniveau.
Grundindekseringsmodulet er fuldt konfigurerbart gennem XSLT-transformation op imod et standard-XML-format (felt-definition, gruppering af felter, rankings-konstanter, sprog-stemming, etc.).
Erfaringerne med Beta og Summa viser, at dette arbejde bedst varetages af biblioteksfagligt personale, med forståelse for simpel XSLT-teknologi. Efter grundindekseringen kan poster umiddelbart fremsøges.
Summa tilbyder også integration af moduler til indexanalyse – disse moduler bruger Summa til implementation af avancerede funktionaliteter. Mulighederne for analyse er ikke begrænset, men i Summa er følgende analyser implementeret (simpleste analyse først):
- Værkvisning.
- Oprettelse af “Did You Mean”-indeks.
- Konceptextraction og clustering (fuldautomatisk klassifikation)
Runtime monitorering af OAI-ingest-filter-modulet i Summa:
