DBC DIGITAL Årsberetning 2025 - Flipbook - Page 26
Smartmatch :
Færre dubletter med
ny matchteknologi
I samarbejde med Det Kgl. Bibliotek har vi
udviklet en ny måde at sammenholde bibliogra昀椀ske
poster på, som styrker datakvaliteten og gør
posterne mere ensartede.
HVER DAG håndterer bibliotekerne store mængder
bibliogra昀椀ske data. Men når 昀氀ere katalogiseringsprak
sisser, historiske forskelle og uensartede data støder
sammen, opstår et velkendt problem: dubletter. Det
gør det sværere for bibliotekernes brugere at 昀椀nde det
rette materiale og for bibliotekerne at vedligeholde
rene bibliogra昀椀ske data.
Med projektet Smartmatch har vi taget et stort skridt
mod at løse netop denne udfordring. Smartmatch
kombinerer klassiske matchregler med maskinlæring
og beregner, hvor sandsynligt det er, at to poster
beskriver den samme udgivelse.
Resultatet er et markant bedre match af poster og et
mere ensartet datagrundlag med færre dubletter. Det
giver bibliotekerne bedre overblik og brugerne mere
præcise søgeresultater.
Fra eksakt til intelligent sammenligning
Der kan være mange årsager til, at poster ikke umid
delbart matcher hinanden :
26
SMARTMATCH
»
»
»
»
forskellig katalogiseringspraksis
ældre registreringer
forskudte eller ufuldstændige oplysninger
små variationer i titler, årstal og identi昀椀katorer
Smartmatch er udviklet til netop at håndtere disse for
skelle. Løsningen kan genkende mønstre og sammen
hænge på tværs af materialer — også når informationen
ikke er registreret på præcis samme måde.
I stedet for alene at vurdere, om to poster ligner hin
anden, analyserer Smartmatch en bred vifte af oplys
ninger, herunder titler, årstal og relationer, og
beregner sandsynligheden for, at posterne beskriver
det samme materiale.
Det er kombinationen af mønstergenkendelse og bibli
ogra昀椀sk viden, der giver de stærke resultater.
Integreres i det daglige arbejde
Tidligere krævede det mange manuelle og tekniske vur
deringer at matche poster, men med Smartmatch er