Skip to main content

Viðburðir

Fyrirlestur á vegum Máltækniseturs

18. september
2023
kl. 12–13

[English below]

Shijun Wang, doktorsnemi í talgreiningu flytur fyrirlesturinn Djúpnám fyrir framsetningu á máltengdum upplýsingum í tali. Fyrirlesturinn fer fram á ensku.

Máltengdar upplýsingar í tali, eins og tilfinningar, talhraði og hljóðstyrkur, gegna lykilhlutverki í að koma á framfæri viðhorfum eða fyrirætlunum þess sem talar. Því miður er oft litið fram hjá þessum þáttum. Í þessari kynningu eru nýstárlegar aðferðir kynntar til að draga fram á áhrifaríkan hátt framsetningu á máltengdum þáttum í tali og tekist á við algengar áskoranir. Enn fremur geta þessar framsetningar bætt verulega ýmis talvinnsluverkefni, þar á meðal raddbreytingu, greiningu á tilfinningum í tali og talgervla sem tjáð geta tilfinningar í raddblæ. Að lokum er fjallað um möguleika á því að nota framsetningu á máltengdum upplýsingum til að auka gæði samskipta manna og tölvu.

Máltæknisetur er samstarfsvettvangur um rannsóknir og þróun í máltækni sem Háskóli Íslands, Háskólinn í Reykjavík og Stofnun Árna Magnússonar í íslenskum fræðum eiga aðild að.

2023-09-18T12:00:00 - 2023-09-18T13:00:00
English

The Icelandic Centre for Language Technology hosts a seminar on September 18th at 12:00, at Edda Conference Room, Arngrímsgata 5, Reykjavík

Shijun Wang, a PhD student in speech recognition gives a talk titled: Deep Learning for Paralinguistic Representation Learning. The talk will be in English.

Paralinguistic elements in speech, such as emotion, speaking speed, and volume, play a crucial role in conveying the speaker's attitudes or intentions. Unfortunately, these elements are often overlooked. In this presentation, innovative approaches are introduced to effectively extract paralinguistic representations and tackle common challenges. Furthermore, these representations can significantly enhance various speech processing tasks, including voice conversion, emotion recognition, and emotional text-to-speech synthesis. In conclusion, this presentation underscores the potential of utilizing paralinguistic representations to enhance the quality of human-computer interactions.