Setningafræðilega greindur textabanki
Undanfarið hefur verið unnið að IcePaHC (Icelandic Parsed Historical Corpus), setningafræðilega greindum textabanka frá öllum öldum íslenskrar ritaldar. Þessu verki er nú lokið - búið er að greina eina milljón orða, u.þ.b. 100 þúsund frá hverri öld. Þar með er þetta orðið einn stærsti banki sinnar tegundar í heiminum.
Nánar