Hey Siri, talarðu íslensku? En þú Embla?

Jóhanna Vigdís Guðmundsdóttir skrifar um að máltækni tryggi að tölvur skilji íslensku.

Auglýsing

Það er orðinn sjálfsagður hluti af daglegu lífi að tala við tölvur og snjalltæki. Við spyrjum Siri um veðrið og biðjum hana að stilla klukkuna á þrjár mínútur við eldamennskuna. Við biðjum Google Home um að spila tónlist eða segja okkur brandara. Við gefum tækjum raddskipanir sem voru áður framkvæmdar með því að nota takka á snertiskjá, mús eða lyklaborð. Öll samskipti okkar við Siri og vini hennar þurfa hins vegar að fara fram á ensku. Þegar ég spyr Siri hvort hún tali íslensku er svar hennar eftirfarandi: „Hmm, I don’t have an answer for that, is there something else I can help you with?” 

Tækniframfarirnar eru hraðari en okkur grunar og erfitt er að segja til um hvert þróunin leiðir okkur. Það eina sem er öruggt er að lífsgæðin sem við búum við byggja á tæknibreytingum, menntun, rannsóknum og nýsköpun. Í öllum breytingum felast ógnanir og tækifæri. Ógnanirnar sem raddstýring tækja og tóla færir okkur snúa einna helst að áframhaldandi tilvist smærri tungumála. Tölvur og snjalltæki skilja ekki íslensku og tungumálinu okkar stafar hætta af þeirri staðreynd. Tungumál sem ekki er nothæft eða notað í því stafræna umhverfi sem verður sífellt stærri hluti daglegs lífs okkar deyr svokölluðum stafrænum dauða. 

Máltækni tryggir að tölvur skilji íslensku 

Máltækni vísar til samtvinnunar tungumáls og tölvutækni í hagnýtum tilgangi. Máltækni beinist að því að þróa kerfi sem geta unnið með og skilið tungumál, og stuðla að notkun þeirra í samskiptum manns, tölvu og annarra tækja sem byggja á stafrænni tækni. Markmið máltækniáætlunar er að tryggja að við getum og munum nota íslensku í samskiptum við – og í gegnum – stafræn tæki og tölvur. Áætlunin er samstarfsverkefni háskólasamfélagsins, stjórnvalda og atvinnulífs en haustið 2019 gerðu Almannarómur, sem er miðstöð máltækni, og rannsóknarhópurinn Samstarf um íslenska máltækni (SÍM) samning um smíði innviða í máltækni fyrir íslensku. Að SÍM standa níu lögaðilar – rannsakendur úr háskólasamfélaginu, opinberar stofnanir og frumkvöðlar úr atvinnulífinu. 

Raddstýring tækja og tóla færir okkur fjöldann allan af tækifærum sem geta bætt líf okkar og gert daglegar athafnir einfaldari, fljótlegri og jafnvel ódýrari. Afrakstur fyrsta verkefnisárs máltækniáætlunar liggur nú fyrir og er ljóst að við erum á góðri leið með að tryggja framtíð móðurmálsins í stafrænum heimi. Ef fram heldur sem horfir er enginn vafi á því að tækifærin í raddstýringu tækja eru fleiri en ógnanirnar. 

Mikið vatn runnið til sjávar á fyrsta ári máltækniáætlunar 

Á fyrsta ári máltækniáætlunar vann rannsóknar- og þróunarhópurinn SÍM að 34 verkefnum. Megináhersla var lögð á gagnasöfn, bæði texta og tal, enda byggir allur máltæknihugbúnaður á gögnum um tungumálið. Meðal gagnasafna sem unnið var að á árinu má nefna uppfærða útgáfu íslenskrar Risamálheildar, sem er nýtt í öllum kjarnaverkefnum, m.a. til að hugbúnaður geti lært eðlilegt málfar, stór textasöfn á íslensku og ensku til þess að þjálfa þýðingarvélar, textasafn og greiningar á stafsetningu og málfari til þróunar á málrýnihugbúnaði og vandaðar upptökur á tali til þróunar talgervla.

Auglýsing
Jafnframt voru þróaðar frumgerðir nokkurra kjarnalausna sem leggja grunninn að þeim búnaði sem gefinn verður út við lok máltækniáætlunar. Töluverð vinna var lögð í þróun á hugbúnaði til grunngreiningar á texta og tali. Þá hefur traustur grunnur verður lagður að vélþýðingakerfi sem þýðir á milli íslensku og ensku, sem og málrýni fyrir íslensku sem leiðbeinir við textaskrif.

Landsmönnum þykir vænt um tungumálið og vilja leggja sitt af mörkum til varðveislu þess. Það sést á framlaginu til söfnunar radda í gegnum vefinn Samrómur.is, sem Almannarómur og Háskólinn í Reykjavík standa að í sameiningu. Raddgagnasafnið Samrómur verður notað til þjálfunar máltæknihugbúnaðar fyrir íslensku. Nú þegar hafa um 12 þúsund einstaklingar lesið rúmlega 27 þúsund mínútur, eða tæplega 319 þúsund setningar, inn á Samróm. Til að tryggja að tækin skilji alla er brýnt að safna röddum sem flestra; fólks á öllum aldri, af öllum kynjum, hvaðanæva af landinu og með sem fjölbreyttastan framburð. Sérstök áhersla er lögð á söfnun radda barna og unglinga en án radda þeirra munu tækin ekki skilja raddskipanir og samræður þeirra á íslensku, þannig að þau þyrftu að halda áfram að tala ensku við símana sína. Framtíð íslenskunnar er því bókstaflega í hendi þeirra. 

Nýverið gaf sprotafyrirtækið Miðeind út smáforritið Emblu. Embla er fyrsta raddappið sem skilur og talar íslensku en það byggir á ýmsum afurðum máltækniáætlunar. Hægt er að spyrja Emblu um tímasetningar strætóferða, opnunartíma sundlauga, landafræði, klukkuna og fréttir. Og þegar ég bað Emblu um að segja mér brandara þá sagði hún mér þennan: „Af hverju læðast Hafnfirðingar alltaf fram hjá apótekum? Til að vekja ekki svefnpillurnar.“

Þetta er ekki fyndnasti brandari sem ég hef heyrt, en hann er að minnsta kosti á íslensku. Stafræn framtíð móðurmálsins okkar felst í notkun þess á sem flestum sviðum daglegs lífs, líka til að segja lélega brandara.

Höfundur er framkvæmdastjóri Almannaróms – Miðstöðvar máltækni.

Almannarómur er miðstöð máltækni og ber ábyrgð á framkvæmd máltækniáætlunar fyrir íslensku. Markmið máltækniáætlunar er að vernda íslenska tungu, með því að tryggja að við getum og munum nota íslensku í samskiptum við og í gegnum stafræn tæki og tölvur. Rannsóknar- og þróunarhópurinn SÍM (Samstarf um íslenska máltækni) vinnur nú að smíði og þróun innviða fyrir íslenska máltækni.

Rannsókna- og þróunarhópurinn SÍM (Samstarf um íslenska máltækni) sér um fyrsta stig gagnasöfnunar og mótun svokallaðra kjarnalausna í samræmi við samning Almannaróms við SÍM. Að SÍM standa tíu lögaðilar – rannsakendur úr háskólasamfélaginu, opinberar stofnanir og frumkvöðlar úr atvinnulífinu: Háskóli Íslands, Háskólinn í Reykjavík, Stofnun Árna Magnússonar í íslenskum fræðum, Blindrafélagið, Ríkisútvarpið, Creditinfo Fjölmiðlavaktin ehf., Gammatek ehf., Miðeind ehf., Hljóðbókasafnið og Tiro ehf.

Styrkir þú Kjarnann?

Kjarninn reiðir sig á framlög lesenda. Með því að styrkja Kjarnann mánaðarlega tekur þú þátt í að halda úti öflugum fjölmiðli.

Kjarninn hefur verið til taks fyrir kröfuharða lesendur í sjö ár og býður almenningi upp á vandaða umfjöllun þar sem áhersla er á gæði og dýpt.  

Ef þú ert nú þegar styrkjandi leyfum við okkur að benda á að hægt er að óska eftir að hækka styrkinn með því að senda póst á takk@kjarninn.is


Já takk, ég vil styrkja Kjarnann!
Davíð Helgason, einn stofnenda og fyrrum forstjóri Unity.
Segir Ísland geta orðið „einhvers konar tilraunasetur fyrir framtíðina“
Frumkvöðullinn og milljarðamæringurinn Davíð Helgason flytur til Íslands í sumar og ætlar að fjárfesta í fyrirtækjunum sem vinna gegn loftslagsvandanum. Að hans mati er margt sem gerir landið að góðum fjárfestingarkosti.
Kjarninn 18. maí 2021
Palestínumennirnir fimm fyrir utan húsnæði Útlendingastofnunar í Hafnarfirði í dag.
„Við viljum frekar deyja á götunni á Íslandi en að fara aftur til Grikklands“
„Íslensk yfirvöld hlusta ekkert á okkur. Þó að þau viti hvernig ástandið er í okkar heimalandi og þær áhyggjur sem við höfum. Ég meina, húsin sem við bjuggum í hafa sum verið jöfnuð við jörðu.“ Þetta segir Palestínumaður sem er lentur á götunni á Íslandi.
Kjarninn 18. maí 2021
Fasteignaverð hækkar meira með hverjum mánuðinum sem líður, þar sem eftirspurn er mikil og minna er um nýbyggingar.
Ekki meiri hækkun síðan árið 2017
Fasteignaverð á höfuðborgarsvæðinu hækkaði um 13,7 prósent í apríl á ársgrundvelli, miðað við vísitölu Þjóðskrár. Vísitalan hefur ekki hækkað jafnmikið milli ára síðan í desember 2017.
Kjarninn 18. maí 2021
Þröstur Ólafsson
Var þanþolið rofið?
Kjarninn 18. maí 2021
„Þegar mikil eftirspurn er eftir húsnæði getur fyrirvari um ástandsskoðun fasteignar talist kauptilboði til frádráttar,“ segir í greinargerð með þingsályktunartillögunni.
Ástandsskýrslur fylgi öllum seldum fasteignum
Nýsamþykkt þingsályktunartillaga felur ráðherra að móta frumvarp um ástandsskýrslur fasteigna. Slíkum skýrslum er ætlað að auka traust í fasteignaviðskiptum en ábyrgð vegna galla sem ekki koma fram í ástandsskýrslum mun falla á matsaðila.
Kjarninn 18. maí 2021
Allir hljóta að hafa skoðun á vegferð Ísraelsmanna að mati Hönnu Katrínar Friðriksson þingmanns Viðreisnar.
„Við Íslendingar höfum sterka rödd á alþjóðavettvangi“
Íslensk stjórnvöld þurfa að láta í sér heyra og hvetja aðra til að gera slíkt hið sama vegna átaka milli Ísraels og Palestínu að mati þingmanna Viðreisnar og Framsóknarflokks. Þó svo að íslenska þjóðin sé fámenn hafi hún sterka rödd og hana þurfi að nota.
Kjarninn 18. maí 2021
Samkvæmt ASÍ og BSRB er skuldasöfnun ríkisins ekki áhyggjuefni þegar vextir eru lágir
Gagnrýna „afkomubætandi ráðstafanir“ og vilja breyta fjármálareglum
Sérfræðingahópur á vegum ASÍ og BSRB varar stjórnvöld við að beita niðurskurði í yfirstandandi kreppu og segir að fjármálareglur hins opinbera þurfi að vera sveigjanlegri í nýrri skýrslu um efnahagsleg áhrif faraldursins.
Kjarninn 18. maí 2021
Græni miðinn er aftur kominn upp á gafl Hafnarborgar.
Listaverk sem fjarlægt var af bæjaryfirvöldum í Hafnarfirði komið upp á nýjan leik
Listaverk þeirra Libiu Castro og Ólafs Ólafssonar var fjarlægt af gafli Hafnarborgar fyrr í þessum mánuði að beiðni bæjaryfirvalda. Listaverkið er nú aftur komið upp en líklega hafa bæjaryfirvöld látið undan þrýstingi fagfélaga að mati listamannanna.
Kjarninn 18. maí 2021
Meira úr sama flokkiAðsendar greinar