Samúel Þórisson, tæknimaður CLARIN á Íslandi og Starkaður Barkarson landsfulltrúi tóku þátt í árlegri CLARIN-ráðstefnu sem haldin var í Prag 10.−12. október. Einnig ber að nefna að Jón Friðrik Daðason, doktorsnemi við Háskólann í Reykjavík, kynnti doktorsverkefni sitt á ráðstefnunni. Auk þess að sitja fyrirlestra sem spönnuðu vítt svið, en tengdust þó ávallt þeirri þjónustu sem CLARIN veitir, sátu Starkaður og Samúel fundi þar sem ýmis mál er varða starfsemi CLARIN voru rædd.
Það var í desember 2018 sem mennta- og menningarmálaráðuneytið fól Árnastofnun að reka CLARIN-miðstöð á Íslandi og uppfyllti þar með skilyrði Íslands til að geta verið aðili að evrópsku rannsóknarinnviðunum CLARIN ERIC árin 2018 til 2022. CLARIN stendur fyrir „Common Language Resources and Technology Infrastructure“ og hefur að meginmarkmiði að stafræn málföng frá öllum Evrópulöndum og hugbúnaður til að vinna með þau verði öllum aðgengileg á einfaldan hátt til nota í hugbúnaðarþróun og rannsóknum í hug- og félagsvísindum og innan máltækni. Hér á landi tengdist CLARIN máltækniáætluninni sterkum böndum enda hafa allar afurðir hennar verið settar á varðveislusvæði CLARIN-IS (https://repository.clarin.is). En þar er þó einnig að finna ýmis önnur málföng, eins og til að mynda Markaða íslenska málheild, Fornritin, Íslenska nútímamálsorðabók og annað sem áður var að finna á vefnum málföng.is.
Frá því að Ísland gerðist fullgildur aðili að CLARIN hafa hátt í 300 málföng verið skráð og send inn til varðveislu hjá CLARIN-IS. Mörg þessara málfanga hafa verið nýtt í hugbúnaðarþróun, bæði hjá innlendum sprotafyrirtækjum og erlendum tæknifyrirtækjum. Sem dæmi fór þróunarhópur í máltækni hjá Microsoft í gegnum gagnasafnið og lét í kjölfarið vita að þar væri fjölmargt sem myndi gagnast fyrirtækinu í að þróa máltækni fyrir íslensku innanhúss hjá sér og yrði notað til þess. Þá hafa gögnin nýst í rannsóknum hér á Íslandi og erlendis. Fjöldi rannsóknargreina á sviðinu eftir íslenska vísindamenn hefur margfaldast á undanförnum árum og aldrei hafa jafnmargir Íslendingar stundað nám í máltækni. Nú eru a.m.k. sex Íslendingar í doktorsnámi í máltækni í fjórum háskólum í þremur löndum en fram til þessa hafa aðeins tveir Íslendingar útskrifast með doktorspróf í máltækni. Þá fer rannsóknum einnig fjölgandi á þessu sviði þar sem íslenska er notuð til að prófa eða þróa aðferðir þótt vísindamennirnir hafi engin tengsl við Ísland í rannsóknum á þessu sviði. Í því samhengi má nefna fjórar greinar á WMT árið 2021, stærstu ráðstefnu í heiminum um vélþýðingar, og rannsókn þriggja vísindamanna við Edinborgarháskóla um aðferðir til að bæta þýðingarvélar sem vinna með tungumál frá minni málsvæðum og kynnt var á ráðstefnu í Bandaríkjunum í júní sl. Allar þessar rannsóknir byggja á gögnum sem hafa verið gerð aðgengileg í gegnum CLARIN og gagnast þær við áframhaldandi þróun verkfæra sem vinna með íslenskt mál.