Skip to main content

Millimál og vélþýðingar í orðabókargerð

Verkefnið hófst um mitt ár 2021. Notaðar eru aðferðir máltækninnar þar sem jafnheiti úr veforðabókunum ISLEX (danska, norska, sænska og finnska) og LEXÍU (franska og þýska) eru notuð sem millimál ('pivot-mál') milli íslensku og ensku. Þannig eru fengin ensk jafnheiti úr heimildum á vefnum, einkum ókeypis orðabókum. Einnig eru notaðar samhliða málheildir milli íslensku og ensku sem hafa orðið til í máltækniverkefnum hjá stofnuninni.

Við þetta verða til langir listar jafnheita, en í sumum tilfellum verða ensku orðin mjög mörg og sum hver ónákvæm eða röng, svo að talsverð eftirvinna þarf að fara fram. Umsjónarmenn verkefnisins vinna áfram með listana yfir orðapörin þar til eftir stendur úrval orða sem eru tæk í orðabók. Það efni er svo lesið inn í gagnagrunn þar sem endanleg orðabókarritstjórn fer fram.

Jafnframt þessu eru notaðar þýðingarvélar ásamt efni úr samhliða og sambærilegum málheildum til að búa til enskar þýðingar á íslenskum notkunardæmum og orðasamböndum. Við það verða til tillögulistar sem fara þarf yfir, og fæst þá smám saman sjálfvirkt mat á því hversu líkleg hver þýðing er til að vera rétt.

Þessar aðferðir flýta umtalsvert fyrir vinnu ritstjóranna sem geta gengið frá stærstum hluta orðabókarinnar mun hraðar en hingað til hefur verið mögulegt. Mat á afrakstri og gæðum þýðinganna fer stöðugt fram á meðan vinnuferlið stendur yfir.

Umsjónarmenn: Þórdís Úlfarsdóttir og Halldóra Jónsdóttir.

Tæknivinnsla: Steinþór Steingrímsson.

Starfsmenn 2021-2022: Björn Halldórsson og Max Naylor.