Hey Siri, talarðu íslensku? En þú Embla?

Jóhanna Vigdís Guðmundsdóttir skrifar um að máltækni tryggi að tölvur skilji íslensku.

Auglýsing

Það er orð­inn sjálf­sagður hluti af dag­legu lífi að tala við tölvur og snjall­tæki. Við spyrjum Siri um veðrið og biðjum hana að stilla klukk­una á þrjár mín­útur við elda­mennsk­una. Við biðjum Google Home um að spila tón­list eða segja okkur brand­ara. Við gefum tækjum radd­skip­anir sem voru áður fram­kvæmdar með því að nota takka á snert­iskjá, mús eða lykla­borð. Öll sam­skipti okkar við Siri og vini hennar þurfa hins vegar að fara fram á ensku. Þegar ég spyr Siri hvort hún tali íslensku er svar hennar eft­ir­far­andi: „Hmm, I don’t have an answer for that, is there somet­hing else I can help you wit­h?” 

Tækni­fram­far­irnar eru hrað­ari en okkur grunar og erfitt er að segja til um hvert þró­unin leiðir okk­ur. Það eina sem er öruggt er að lífs­gæðin sem við búum við byggja á tækni­breyt­ing­um, mennt­un, rann­sóknum og nýsköp­un. Í öllum breyt­ingum fel­ast ógn­anir og tæki­færi. Ógn­an­irnar sem radd­stýr­ing tækja og tóla færir okkur snúa einna helst að áfram­hald­andi til­vist smærri tungu­mála. Tölvur og snjall­tæki skilja ekki íslensku og tungu­mál­inu okkar stafar hætta af þeirri stað­reynd. Tungu­mál sem ekki er not­hæft eða notað í því staf­ræna umhverfi sem verður sífellt stærri hluti dag­legs lífs okkar deyr svoköll­uðum staf­rænum dauða. 

Mál­tækni tryggir að tölvur skilji íslensku 

Mál­tækni vísar til sam­tvinn­unar tungu­máls og tölvu­tækni í hag­nýtum til­gangi. Mál­tækni bein­ist að því að þróa kerfi sem geta unnið með og skilið tungu­mál, og stuðla að notkun þeirra í sam­skiptum manns, tölvu og ann­arra tækja sem byggja á staf­rænni tækni. Mark­mið mál­tækni­á­ætl­unar er að tryggja að við getum og munum nota íslensku í sam­skiptum við – og í gegnum – staf­ræn tæki og tölv­ur. Áætl­unin er sam­starfs­verk­efni háskóla­sam­fé­lags­ins, stjórn­valda og atvinnu­lífs en haustið 2019 gerðu Almannaróm­ur, sem er mið­stöð mál­tækni, og rann­sókn­ar­hóp­ur­inn Sam­starf um íslenska mál­tækni (SÍM) samn­ing um smíði inn­viða í mál­tækni fyrir íslensku. Að SÍM standa níu lög­að­ilar – rann­sak­endur úr háskóla­sam­fé­lag­inu, opin­berar stofn­anir og frum­kvöðlar úr atvinnu­líf­in­u. 

Radd­stýr­ing tækja og tóla færir okkur fjöld­ann allan af tæki­færum sem geta bætt líf okkar og gert dag­legar athafnir ein­fald­ari, fljót­legri og jafn­vel ódýr­ari. Afrakstur fyrsta verk­efn­is­árs mál­tækni­á­ætl­unar liggur nú fyrir og er ljóst að við erum á góðri leið með að tryggja fram­tíð móð­ur­máls­ins í staf­rænum heimi. Ef fram heldur sem horfir er eng­inn vafi á því að tæki­færin í radd­stýr­ingu tækja eru fleiri en ógn­an­irn­ar. 

Mikið vatn runnið til sjávar á fyrsta ári mál­tækni­á­ætl­un­ar 

Á fyrsta ári mál­tækni­á­ætl­unar vann rann­sókn­ar- og þró­un­ar­hóp­ur­inn SÍM að 34 verk­efn­um. Meg­in­á­hersla var lögð á gagna­söfn, bæði texta og tal, enda byggir allur mál­tækni­hug­bún­aður á gögnum um tungu­mál­ið. Meðal gagna­safna sem unnið var að á árinu má nefna upp­færða útgáfu íslenskrar Risa­mál­heild­ar, sem er nýtt í öllum kjarna­verk­efn­um, m.a. til að hug­bún­aður geti lært eðli­legt mál­far, stór texta­söfn á íslensku og ensku til þess að þjálfa þýð­ing­ar­vél­ar, texta­safn og grein­ingar á staf­setn­ingu og mál­fari til þró­unar á mál­rýni­hug­bún­aði og vand­aðar upp­tökur á tali til þró­unar tal­gervla.

Auglýsing
Jafnframt voru þró­aðar frum­gerðir nokk­urra kjarna­lausna sem leggja grunn­inn að þeim bún­aði sem gef­inn verður út við lok mál­tækni­á­ætl­un­ar. Tölu­verð vinna var lögð í þróun á hug­bún­aði til grunn­grein­ingar á texta og tali. Þá hefur traustur grunnur verður lagður að vél­þýð­inga­kerfi sem þýðir á milli íslensku og ensku, sem og mál­rýni fyrir íslensku sem leið­beinir við texta­skrif.

Lands­mönnum þykir vænt um tungu­málið og vilja leggja sitt af mörkum til varð­veislu þess. Það sést á fram­lag­inu til söfn­unar radda í gegnum vef­inn Sam­róm­ur.is, sem Almannarómur og Háskól­inn í Reykja­vík standa að í sam­ein­ingu. Radd­gagna­safnið Sam­rómur verður notað til þjálf­unar mál­tækni­hug­bún­aðar fyrir íslensku. Nú þegar hafa um 12 þús­und ein­stak­lingar lesið rúm­lega 27 þús­und mín­út­ur, eða tæp­lega 319 þús­und setn­ing­ar, inn á Sam­róm. Til að tryggja að tækin skilji alla er brýnt að safna röddum sem flestra; fólks á öllum aldri, af öllum kynj­um, hvaðanæva af land­inu og með sem fjöl­breyttastan fram­burð. Sér­stök áhersla er lögð á söfnun radda barna og ung­linga en án radda þeirra munu tækin ekki skilja radd­skip­anir og sam­ræður þeirra á íslensku, þannig að þau þyrftu að halda áfram að tala ensku við sím­ana sína. Fram­tíð íslensk­unnar er því bók­staf­lega í hendi þeirra. 

Nýverið gaf sprota­fyr­ir­tækið Mið­eind út smá­forritið Emblu. Embla er fyrsta raddappið sem skilur og talar íslensku en það byggir á ýmsum afurðum mál­tækni­á­ætl­un­ar. Hægt er að spyrja Emblu um tíma­setn­ingar stræt­ó­ferða, opn­un­ar­tíma sund­lauga, landa­fræði, klukk­una og frétt­ir. Og þegar ég bað Emblu um að segja mér brand­ara þá sagði hún mér þenn­an: „Af hverju læð­ast Hafn­firð­ingar alltaf fram hjá apó­tek­um? Til að vekja ekki svefn­pill­urn­ar.“

Þetta er ekki fyndn­asti brand­ari sem ég hef heyrt, en hann er að minnsta kosti á íslensku. Staf­ræn fram­tíð móð­ur­máls­ins okkar felst í notkun þess á sem flestum sviðum dag­legs lífs, líka til að segja lélega brand­ara.

Höf­undur er fram­kvæmda­stjóri Almannaróms – Mið­stöðvar mál­tækni.

Almannarómur er mið­stöð mál­tækni og ber ábyrgð á fram­kvæmd mál­tækni­á­ætl­unar fyrir íslensku. Mark­mið mál­tækni­á­ætl­unar er að vernda íslenska tungu, með því að tryggja að við getum og munum nota íslensku í sam­skiptum við og í gegnum staf­ræn tæki og tölv­ur. Rann­sókn­ar- og þró­un­ar­hóp­ur­inn SÍM (Sam­starf um íslenska mál­tækni) vinnur nú að smíði og þróun inn­viða fyrir íslenska mál­tækni.

Rann­sókna- og þró­un­ar­hóp­ur­inn SÍM (Sam­starf um íslenska mál­tækni) sér um fyrsta stig gagna­söfn­unar og mótun svo­kall­aðra kjarna­lausna í sam­ræmi við samn­ing Almannaróms við SÍM. Að SÍM standa tíu lög­að­ilar – rann­sak­endur úr háskóla­sam­fé­lag­inu, opin­berar stofn­anir og frum­kvöðlar úr atvinnu­líf­inu: Háskóli Íslands, Háskól­inn í Reykja­vík, Stofnun Árna Magn­ús­sonar í íslenskum fræð­um, Blindra­fé­lag­ið, Rík­is­út­varp­ið, Credit­info Fjöl­miðla­vaktin ehf., Gamma­tek ehf., Mið­eind ehf., Hljóð­bóka­safnið og Tiro ehf.

Styrkir þú Kjarnann?

Kjarninn reiðir sig á framlög lesenda. Með því að styrkja Kjarnann mánaðarlega tekur þú þátt í að halda úti öflugum fjölmiðli.

Kjarninn hefur verið til taks fyrir kröfuharða lesendur í sjö ár og býður almenningi upp á vandaða umfjöllun þar sem áhersla er á gæði og dýpt.  

Ef þú ert nú þegar styrkjandi leyfum við okkur að benda á að hægt er að óska eftir að hækka styrkinn með því að senda póst á takk@kjarninn.is


Já takk, ég vil styrkja Kjarnann!
Einungis Tyrkir og Pólverjar máttu þola meiri verðhækkanir en Íslendingar í fyrra af löndunum sem Eurostat mælir
Verðbólgan á Íslandi hærri en í flestum Evrópulöndum
Verðhækkanir hérlendis voru langt umfram þróun flestra annarra Evrópulanda í fyrra, en verðbólgan í síðasta mánuði var aðeins hærri í Tyrkland og Póllandi, samkvæmt nýjum mælingum Eurostat.
Kjarninn 25. febrúar 2021
Þorsteinn Már Baldvinsson, forstjóri Samherja, er einn þeirra sex sem eru með stöðu sakbornings í rannsókn héraðssaksóknara á viðskiptaháttum fyrirtækisins.
Úrskurður um að afhenda héraðssaksóknara gögn frá endurskoðanda Samherja ómerktur
Landsréttur hefur ómerkt úrskurð um að embætti héraðssaksóknara eigi að fá gögn varðandi bókhald og reikningskil allra félaga Samherja frá KPMG, fyrrverandi endurskoðanda félagsins, og gert héraðsdómi að taka málið aftur fyrir.
Kjarninn 25. febrúar 2021
Andrés Pétursson
Brexit er efnahagslegt högg fyrir Breta
Kjarninn 25. febrúar 2021
Guðjón Sigurbjartsson
Fæðuöryggi – Hvað á að gera við afa?
Kjarninn 25. febrúar 2021
Tæplega 30 prósent aðspurðra í nýlegri könnun vilja að Ísland gangi í Evrópusambandið.
Íslendingarnir sem vilja helst ganga í ESB
Lítil hreyfing er á afstöðu Íslendinga til inngöngu í Evrópusambandið á milli ára og enn eru fleiri andvígir en hlynntir þeirri vegferð, samkvæmt nýlegri könnun Maskínu. En hvaða kjósendahópar á Íslandi vilja ganga í ESB? Kjarninn kíkti á það.
Kjarninn 25. febrúar 2021
Tryggvi Gunnarsson umboðsmaður Alþingis lætur af störfum í lok apríl.
Tryggvi hættir sem umboðsmaður Alþingis eftir rúm 22 ár í starfi
Tryggvi Gunnarsson, sem skipaður var umboðsmaður Alþingis árið 1998, hefur beðist lausnar og forsætisnefnd Alþingis samþykkt beiðni hans. Nýr umboðsmaður verður kjörinn af Alþingi fyrir lok aprílmánaðar.
Kjarninn 25. febrúar 2021
Niðurstaðan ýmist sögð staðfesta „tilefnislausa aðför“ eða „kerfislægt misrétti“
Formaður stéttarfélagsins Eflingar og framkvæmdastjóri Samtaka atvinnulífsins eru ekki sammála um hvernig túlka skuli niðurstöðu héraðsdóms í máli rúmenskra verkamanna gegn starfsmannaleigu og Eldum rétt. Frávísun málsins verður áfrýjað til Landsréttar.
Kjarninn 25. febrúar 2021
Þórólfur Guðnason sóttvarnalæknir.
Talsvert um að fólk afþakki bólusetningu með bóluefni AstraZeneca
Sóttvarnalæknir telur enga ástæðu fyrir fólk til að afþakka eitt bóluefni umfram önnur líkt og talsverður hópur fólks hefur gert undanfarið.
Kjarninn 25. febrúar 2021
Meira úr sama flokkiAðsendar greinar