Skip to main content

Viðburðir

Opnun risamálheildar

4. maí
2018
kl. 13

Risamálheildin var opnuð formlega 4.maí.

Árið 2013 var veittur aðgangur að verkinu Mörkuð íslensk málheild (MÍM) á vef Stofnunar Árna Magnússonar í íslenskum fræðum (http://mim.arnastofnun.is/). MÍM er safn um 25 milljóna orða af margvíslegum textum sem hafa verið greindir málfræðilega (markaðir). 

Markaðir textar í MÍM eru ætlaðir fyrir rannsóknir á íslensku máli og fyrir máltækniverkefni. Það kom hins vegar fljótt í ljós að mörg máltækniverkefni krefjast mun stærra textasafns en MÍM ræður yfir. Þess vegna var ráðist í gerð Risamálheildar sem hefði mun meira af textum. Því verki er nú lokið.

Í Risamálheildinni eru um 1300 milljónir lesmálsorða af texta. Hluti textanna er opinberir textar (Alþingisræður allt frá 1907, lagatextar, dómar). Einnig fengust stór textasöfn frá ýmsum fjölmiðlum. Risamálheildin er mörkuð málheild eins og MÍM. Málfræðigreiningin gefur færi á markvissri leit í textunum. Verkið var unnið á Stofnun Árna Magnússonar í íslenskum fræðum á árunum 2015 til 2017 að mestu fyrir styrki frá Innviðasjóði, Mótframlagasjóði Háskóla Íslands og mennta- og menningarmálaráðuneyti. Leita má í textunum á vefsetrinu http://malheildir.arnastofnun.is/ og sækja má textana á vefsetrið málföng.is til þess að nota þá í málrannsóknum og í máltækniverkefnum.

 

2018-05-04T13:00:00