Ida Asp læser historie på Københavns Universitet og er dette efterår i praktik hos Link-Lives. Ida rapporterer i dette blogindlæg fra Link-Lives Årsseminar.
Mandag den 27. september samledes alle Link-Lives deltagere for første gang på samme lokalitet siden Coronaepidemiens udbrud. Det var en dag med spændende oplæg om hvad projektet har opnået og dets fremtidsplaner.
Siden sidste årsseminar i februar 2020 har projektet nået en lang række mål, til trods for nedlukningen og hjemmearbejde.
Besøg fra Skotland
Dagen indledtes af Chris Dibben, professor i geografi fra University of Edinburgh, der fortalte om projektet Digitising Scotland. Chris gav interessante perspektiver på hvad digitalisering kan tilføre forskningen.
Ved brug af machine learning har projektet i Skotland bl.a. overført gamle bykort til moderne kort. På den måde har forskere kunnet drage vigtige konklusioner om bebyggelsestæthed i starten af det 20. århundrede og dennes sammenhæng med luftforurening og sygdomme. Bagefter fulgte en interessant diskussion af, hvad Link-Lives kan tage med fra den skotske forskning, og vice versa.

Lancering af søgefunktion i 2022
Til forrige årsseminar i 2020 fortalte arkivar ved Københavns Stadsarkiv Signe Trolle Gronemann om udviklingen af en beta-søgefunktion, hvor livsforløb bliver søgbare for alle danskere.
Signes præsentation ved dette årsseminar viste, at arbejdet er nået meget langt siden sidst. Efter at forskellige brugergrupper har testet hjemmesiden kan vi konkludere, at siden fungerer godt, sagde Signe. Nu mangler der kun nogle justeringer før siden kan lanceres i 2022.

Supervised vs. unsupervised machine learning
IT-specialist Nicolai Rask Mathiesen og ph.d.-stipendiat Roc Reguant præsenterede to forskellige machine learning-metoder. Machine learning betyder kort fortalt, at man oplærer et computerprogram til for eksempel, i vores tilfælde, at kende forskel på links og ikke-links.
De foreløbige testresultater tyder på, at denne metode faktisk kan blive lige så dygtig som de historikere, der har lavet træningslinkene.
Hidtil har Link-Lives arbejdet med at bruge manuelle links som træningsdata til computerprogrammet. Eftersom manuel linking kræver ekspertkapacitet og tager lang tid, er det nødvendigt at supplere med machine learning, hvis vi skal kunne linke alle danske borgere fra 1768 og fremefter.
Roc Reguant har som en del af sit ph.d.-projekt eksperimenteret med en anden metode kaldet unsupervised machine learning. Ved denne metode kan man bygge en algoritme til, på egen hånd, at opfange de relevante forskelle og ligheder i data, der gør det muligt at lave links.
Denne metode vil altså kunne linke personforekomster imellem de forskellige kilder, uden brug af menneskeskabte træningslinks. Man har dog stadig brug for historikere og andre eksperter. Deres links skal bruges til at teste, hvor god algoritmen er til at efterligne vores beslutninger.
Rocs oplæg førte til livlig diskussion om muligheder og begrænsninger ved de to metoder. Hvis de to metoder kan bruges i samspil, kan projektet blive endnu mere effektivt.
Dagens afslutning
Ved udgangen af dagen var alle seminarets deltagere beriget med ny eller opdateret viden inden for de mange aspekter af projektet. En viden som blev taget med videre til refleksion og diskussion ved en uformel middag, der dannede rammen om seminarets afsluttende timer.
