Hafin er vinna við verkefnið Mikilvægur orðaforði fyrir fjöltyngi og vélþýðingar sem lýtur að því að búa til verkfæri sem auðvelda þeim sem eru að læra íslensku að efla íslenskufærni sína. Sérstök áhersla er lögð á þekkingu á mikilvægum íslenskum orðaforða sem birtist í margs konar tegundum texta (námsorðaforða). Afurðir verkefnisins munu einnig nýtast við þjálfun íslenskra nemenda í lesskilningi og tjáningarfærni og jafnframt til að prófa og bæta þýðingarvélar á milli íslensku og sex tungumála innflytjenda á Íslandi. Verkefnið hlaut styrk frá Rannís úr Markáætlun í tungu og tækni síðastliðið sumar. Það er unnið í samstarfi Stofnunar Árna Magnússonar í íslenskum fræðum (SÁM), Menntavísindasviðs Háskóla Íslands og Hugvísindasviðs Háskóla Íslands.
Til grundvallar verkefninu er Listi yfir íslenskan námsorðaforða (LÍNO-2), unninn á Menntavísindasviði HÍ. Hann er byggður á greiningu stórs safns fræðilegra samtímatexta, opinberra texta og fréttatexta og inniheldur orð sem eru algeng þvert á fræðasvið. Þekking á þessum orðaforða er nauðsynleg til að öðlast góðan lesskilning í íslensku.
Þórunn Rakel Gylfadóttir og Berglind Erna Tryggvadóttir, meistaranemar í ritlist við HÍ, munu semja stutta texta sem hafa að geyma þennan mikilvæga orðaforða. Sögurnar verða á ólíkum erfiðleikastigum Evrópska tungumálarammans. Stefanie Bade málfræðingur mun vinna að því að skilgreina kröfur um íslenska málfræðiþekkingu fyrir hvert stig rammans.
Tvímála smáorðabækur, sem innihalda orðaforðann í LÍNO-2 með skýringum, verða gefnar út á netinu samhliða textunum. Við gerð þeirra verða orðabækur SÁM hafðar til hliðsjónar en einnig verður stuðst við nýjar máltækniaðferðir fyrir orðabókavinnu. Grunnmálið í þeim öllum er íslenska en markmálin verða sex: enska, pólska, spænska, taílenska, filippseyska og úkraínska. Textar Þórunnar Rakelar og Berglindar Ernu verða þýddir á þessi sex tungumál og gefnir út með opnu leyfi. Það gefur kost á því að textarnir nýtist sem flestum án nokkurra hindrana. Einnig verður unnið að margmála málheild fyrir vélþýðingar á bókmenntatextum milli þessara sjö tungumála.
Auk Þórunnar Rakelar, Berglindar Ernu og Stefanie koma að verkefninu Sigríður Ólafsdóttir og Auður Pálsdóttir, dósentar á Menntavísindasviði HÍ, Hanna Óladóttir, lektor á Menntavísindasviði HÍ, Ármann Jakobsson, prófessor á Hugvísindasviði HÍ, Einar Freyr Sigurðsson, rannsóknarlektor hjá SÁM, Ágústa Þorbergsdóttir, málfræðingur hjá SÁM, Atli Jasonarson, sérfræðingur í máltækni, og Steinþór Steingrímsson, verkefnisstjóri hjá SÁM, sem stýrir verkefninu. Þá munu þýðendur og forritarar vinna við afmarkaða hluta verkefnisins.