Skip to main content

Pistlar

Úr skjalaskápum upp á skjá

Hvernig í ósköpunum á að taka skjöl úr skjalaskápum og gera þau aðgengileg almenningi á netinu með skikkanlegum hætti? Það var úrlausnarefnið sem nafnfræðisvið Árnastofnunar stóð frammi fyrir þegar tekin hafði verið ákvörðun um að gera örnefnasafn stofnunarinnar aðgengilegt á netinu.

Verkefnið var unnið í samstarfi Stofnunar Árna Magnússonar í íslenskum fræðum og Landmælinga Íslands með tilstyrk Innviðasjóðs Rannís og Styrktarsjóðs Áslaugar Hafliðadóttur. Stofnanirnar lögðu hvor fyrir sig til sérþekkingu sína og reynslu en styrkirnir gerðu kleift að ráða starfsfólk til þess að sinna verkefninu, ýmist í fullu starfi eða að hluta.

Uppi á vegg hjá örnefnasafninu hanga myndir sem sýna framvindu verkefnisins á ýmsum tímum.
Uppi á vegg hjá örnefnasafninu hanga myndir sem sýna framvindu verkefnisins á ýmsum tímum.

Örnefnasafnið samanstendur af skjölum á borð við örnefnalýsingar, uppdrætti, skrifleg svör við spurningum stofnunarinnar og athugasemdum sem sendar hafa verið inn. Skjölin eru geymd í skjalaskápum þar sem skúffur geyma sýslur og hver hreppur eða sveitarfélag á sér sínar möppur sem geyma skjöl með upplýsingum og örnefnum í landi hvers bæjar. Allar sýslur eiga sér númer og svo er hver hreppur innan sýslunnar númeraður undir sýslunúmerinu. Öll þessi skjöl þurfti að skrá í gagnagrunn, lesa úr þeim texta svo hann yrði aðgengilegur með rafrænum hætti og gera þannig örnefnin og örnefnalýsingarnar að leitarbærum gögnum á netinu.

Fyrsta skrefið var að skanna skjölin og koma þeim á tölvutækt snið en það skref hafði í raun verið stigið nánast að fullu þegar smíði gagnagrunns og viðmóts á hann hófst. Öllum þessum skönnuðu skjölum var komið fyrir í möppum og undirmöppum á miðlara stofnunarinnar, sem endurspeglaði algerlega skipulag skjalaskápanna.

Næsta skref sem stigið var á þessari leið var að lesa upp öll skjölin af miðlaranum og skrá þau inn í gagnagrunn í tilsvarandi hreppa og sýslur eins og möppurnar sögðu til um. Þannig voru um 15 þúsund skjöl skráð inn í gagnagrunninn í einni svipan, en það var bara byrjunin.

Vaskur hópur nema var ráðinn til að fara yfir skráningu skjalanna, tilgreina hvers eðlis hvert skjal er, bera saman við skönnuðu skjölin og tengja hvert skjal við þann bæ sem skjalið tilheyrir. Til þess að einfalda þá vinnu var bæjatal Landsbókasafns nýtt, það allt lesið inn í okkar gagnagrunn og skjölin tengd við bæina. Með því sparaðist töluverð vinna þar sem ekki þurfti að skrá alla bæi í höndunum og að auki fylgja landfræðileg hnit með flestum bæjum í bæjatalinu.

Þannig var gríðarlegur fjöldi skjala tengdur við hnitsetta bæi og þar með skapaðist strax grundvöllur til þess að útbúa framvindukort fyrir verkefnið þar sem Íslandskort sýndi punkta fyrir alla þekkta bæi og breyttist litur punktanna eftir því sem skráningu og yfirferð fleytti fram. Í fyrstu var allt rautt en smátt og smátt urðu hreppar, sýslur og landsvæði iðjagræn. Skráning skjalanna á bæi og yfirferð tók nokkurn tíma en vannst þó hratt og vel í höndum nemanna sem lögðu sig fram og sýndu verkefninu, blessunarlega, mikinn áhuga.

Þegar skráningu var lokið og yfirferð komin vel á veg hófst næsti stóri verkþáttur verkefnisins sem var ljóslestur skjalanna. Með ljóslestri er átt við það ferli að lesa skjölin vélrænt og greina texta þeirra og gera hann aðgengilegan. Til að ljóslestur heppnist sem best þurfa skjölin sem lesa á að vera eins skýr og unnt er og allar síður að snúa rétt og vera í réttri afstöðu.

Nokkrar atrennur voru gerðar að ljóslestrinum en smátt og smátt varð til aðferðafræði sem skilaði góðum árangri og varð árangurshlutfall ljóslestursins mjög gott. Vissulega eru skjöl innan um sem erfitt og jafnvel ógerningur er að lesa með þessum hætti. Helgast það fyrst og fremst af samspili bleks og pappírs; ef pappír er þunnur og ásláttur ritvélarinnar þungur þá gerist það gjarnan að letur á annarri hlið blaðsins blæðir í gegn svo að grillir í það á hinni hliðinni. Einnig á ritvélablek það til að renna út eða fölna og verða óskýrt. Allt þetta gerir að verkum að ljóslesturinn verður torveldari og lýsir það sér oftast í því að tólið sem nýtt var til ljóslestursins telur sig sjá orð þar sem aðeins er um kám eða skugga leturs á hinni hlið síðunnar er að ræða eða að ógreinilegir stafir eru mislesnir.

Eftir að ljóslestri lauk voru önnur tól nýtt til þess að veiða út örnefnalistana sem einatt eru aftast í örnefnaskránum. Eftir að örnefnin höfðu verið lesin út úr skjölunum voru þau gróflesin og augljós mistök í ljóslestri lagfærð, og svo voru öll örnefnin lesin inn í gagnagrunninn og tengd við örnefnaskrárnar sem þau voru lesin úr.

Þá tók við annað skeið tafsamrar handavinnu sem var að lesa saman örnefnalistana í skönnuðu skjölunum og þá sem höfðu skilað sér úr ljóslestrinum. Nemendahópurinn leysti það verk hratt og örugglega og á endanum þóttumst við vera komin með um 400 þúsund yfirfarin örnefni í gagnagrunninn. Leitast var við að viðhalda rithætti örnefnanna í örnefnalýsingunum, ef hann var frábrugðinn því sem telst eðlilegur ritháttur í dag, en skrá þau einnig samræmd til nútímastafsetningar, en slík samræming gefur kost á fjölbreyttari leitarmöguleikum. Þannig eru til dæmis örnefni sem innihalda bókstafinn „z“ einnig skráð með „s“ og annað þess háttar.

Í kjölfarið var örnefnalistinn ásamt hnitum þeirra bæja sem örnefnin voru tengd við send til úrvinnslu hjá Landmælingum Íslands. Þar var listinn keyrður í gegnum ferli sem leitaðist við að para saman örnefnin okkar við hnitsett örnefni í gagnagrunni LMÍ miðað við hnit bæjanna sem örnefnin eru skráð á hjá okkur. Þessi samkeyrsla skilaði sér í því að ríflega 90 þúsund örnefni voru hnitsett. Það sem eftir stendur eru örnefni sem skráð eru á bæi sem ekki eru hnitsettir í því bæjatali sem notað var við skráninguna auk fjölda örnefna sem tilheyra alls ekki bæjum og eru jafnvel á landsvæðum sem falla innan margra hreppa, og jafnvel margra sýslna eða sveitarfélaga. Þar má nefna sem dæmi örnefni á Holtavörðuheiði sem eru á svæði sem tilheyrði Mýrasýslu, Dalasýslu, Strandasýslu og Vestur-Húnavatnssýslu – upp á gamlamóð – eða sveitarfélögunum Dalabyggð, Borgarbyggð og Húnaþingi vestra í dag. Gögn um þessi örnefni eru skráð í grunninn en hafa enn ekki komist á framfæri. Næstu skref í frágangi örnefnasafnsins á netinu felast meðal annars í að útbúa fjölbreyttari aðkomu og uppflettingu í safninu en á forsendum bæjatalsins.

Nú þegar hefur gríðarlegt starf verið unnið í verkefninu og góður grundvöllur lagður fyrir frekari framþróun. Aðgengi almennings að gögnum örnefnasafnsins hefur augljóslega verið bætt til mikilla muna en einnig munu verða opnuð forritsskil, eða API, sem gefur kost á að sækja gögn til notkunar í öðrum kerfum.

Spennandi varða á þessari vegferð er samstarfsverkefni Árnastofnunar og Landmælinga Íslands sem hleypt verður af stokkunum nú í haust og felst í því að virkja almenning í að hnitsetja örnefni, ýmist í heimahögum sínum eða á ferð um landið. Í gegnum tíðina hefur fjöldi fólks tekið þátt í slíkri vinnu fyrir LMÍ og lagt af mörkum drjúgan skerf til hnitsetninga örnefna. Vonir eru bundnar við að með átakinu muni hnitsettum örnefnum í gagnagrunnum beggja stofnana fjölga enn frekar og að nákvæmni þeirra aukist og um leið glæðist áhugi almennings á örnefnum, tilurð þeirra, tilgangi og merkingu.

 

Örnefnasafnið er öllum aðgengilegt á nafnið.is.

 

Birt þann 24. maí 2021
Síðast breytt 24. október 2023