Udsnit af Eggeslevmagle sogn, 1812
Udsnit af Eggeslevmagle sogn, 1812. Fra hkpn.gst.dk
3 minutter

Kært sted har mange navne

Der er registeret langt over en halv million unikke stavemåder af fødesteder i de transskriberede folketællinger fra 1845 til 1901.

Eggislevmagle, Eggislslevmagle, Eggisløvmagle, Eggitslevmagle, Eggitsløvmagle, Eggitzløvmagle eller Eggeslevmagle? Ja, kært sted har mange navne eller rettere mange stavemåder. Faktisk er der registeret langt over en halv million unikke stavemåder af fødesteder i de transskriberede folketællinger fra 1845 til 1901.

En af årsagerne til de mange forskellige stavemåder er, at forestillingen om en retstavning, altså at ét ord har én korrekt stavemåde, først tog fart i løbet af sidste halvdel af 1800-tallet. Det tog naturligvis sin tid for folk at vænne sig til. Så når forskellige folketællere skrev Eggeslevmagle, sådan som de selv syntes, det skulle være, var det helt naturligt i datiden. Derfor staves fødesteder og for den sags skyld også for- og efternavne ikke nødvendigvis ens fra den ene folketælling til den næste, selvom informationerne omhandler den samme person. Selv inden for den samme folketælling er samme sted ofte stavet forskelligt.

De mange forskellige variationer af det samme fødested, gør det svært at sammenkoble informationer om den samme person gennem et helt liv. Derfor tildeler Link-Lives en standardiseret stavemåde til hvert unikt stavet fødested ud fra en referenceliste med udgangspunkt i DigDag, som allerede indeholder standardiserede stavemåder af mange danske administrative enheder som for eksempel sogne, se www.digdag.dk. Med langt over 500.000 unikke stavemåder af fødesteder er dette ikke en opgave, som udføres manuelt ved at indtaste den korrekte standardiserede stavemåde ved hver enkelt post, da det vil være for tidskrævende.

Link-Lives har derfor som noget af det første givet sig i kast med at udarbejde synonymlister. Det er tabeller, der indeholder alle de originale stavemåder i folketællingerne i alfabetisk rækkefølge i én kolonne og så en standardstavemåde fra referencelisten, vi har valgt, i en kolonne ved siden af. Derved bevares folketællingernes oprindelige stavemåde, mens det samtidigt bliver lettere at linke informationer om den samme person over tid.

Hvordan vælger vi så, hvilken standardiseret stavemåde der passer? Vi benytter algoritmer og computerteknologi, som automatisk kan foreslå et synonym fra referencelisten. Algoritmerne finder således et match mellem den originale kilde og referencelisten, så der kan tildeles et synonym. Hvis det fremkomne match er 100% korrekt, tildeles synonymet med det samme. Hvis der derimod er nogle variationer, foreslår algoritmen et muligt match, der skal godkendes af en historiker. I de fleste tilfælde finder algoritmen et korrekt match, når to ord er næsten identiske som for eksempel Neksø Købstad og Nexø Købstad. Dog skal vi være opmærksomme på, at algoritmen i den forbindelse også ville foreslå, at Frederiksberg er det samme som Frederiksborg, hvilket vi historikere udmærket ved ikke er tilfældet. Målet er derfor at udnytte computerens egenskaber til at udføre dette arbejde langt hurtigere, end et menneske kan, men i sammenhæng med historikernes ekspertise for at opnå et korrekt resultat.

Når synonymlisterne er færdige, og hvert registreret fødested i folketællingerne har fået tildelt et standardiseret synonym, bliver det lettere at linke personer over tid og skabe livsforløb. Fordi vi benytter DigDag som referenceliste, vil det også blive lettere at plotte livsforløbene ind på et kort i fremtiden, da DigDag indeholder koordinater for hvert sted.