Mörkuð íslensk málheild
Málheildin er safn af fjölbreyttum textum sem eru geymdir í stöðluðu sniði í rafrænu formi. Orð í textunum eru greind málfræðilega og hverjum texta fylgja bókfræðilegar upplýsingar um verkið sem textinn er úr. Málheildin er ætluð fyrir málrannsóknir og til notkunar í máltækniverkefnum.
Íslenskt textasafn
Í safninu eru gamlir og nýir textar af ýmsum toga sem skiptast á milli 30 efnisflokka. Textasafnið er mikilvægt hjálpargagn þeim sem fást við rannsóknir sem varða íslenskt mál, sagnfræði o.fl.
Orðstöðulyklar
Skrá yfir orðmyndir sem koma fyrir í tilteknum texta eða textum, ásamt upplýsingum um nánasta samhengi þeirra. Gerðir hafa verið slíkir orðstöðulyklar fyrir nokkra texta og textaflokka úr textasafninu. Þetta eru einkum gamlir textar sem ekki eru háðir höfundarrétti eða textar sem leyfi hefur fengist til að nota í þessu samhengi.
Ensk-íslensk hliðstæð málheild
Málheild (ParIce) ætluð fyrir þjálfun á vélþýðingabúnaði. Hún samanstendur af ýmsum undirmálheildum. Sumar þeirra voru settar saman frá grunni en öðrum safnað af vefnum, þeim síðan samraðað og síaðar.
Málheildin Gamli
Málheild fyrir íslenskar munnmælasögur og sú fyrsta sinnar tegundar á Íslensku. Gögn málheildarinnar Gamla eru fengin úr hljóðritum þjóðfræðisafns Árnastofnunar sem öll eru aðgengileg á ismus.is.
Ritmálssafn
Safnið spannar tímabilið frá 1540 til nútímans. Gagnasafnið geymir upplýsingar um öll orð í Ritmálssafni Orðabókar Háskólans auk notkunardæma um flest þeirra. Auk þess eru þar upplýsingar um heimildirnar sem dæmin eru sótt til.
Orðasambönd
Skráin er unnin upp úr tölvuskráðum notkunardæmum úr Ritmálssafni Orðabókar Háskólans sem spanna íslenskar ritheimildir allt frá miðri 16. öld. Í skránni birtist fjölbreytileg mynd af notkun einstakra orða í föstum samböndum og í dæmigerðu samhengi við önnur orð.