Hey Siri, talarðu íslensku? En þú Embla?

Jóhanna Vigdís Guðmundsdóttir skrifar um að máltækni tryggi að tölvur skilji íslensku.

Auglýsing

Það er orð­inn sjálf­sagður hluti af dag­legu lífi að tala við tölvur og snjall­tæki. Við spyrjum Siri um veðrið og biðjum hana að stilla klukk­una á þrjár mín­útur við elda­mennsk­una. Við biðjum Google Home um að spila tón­list eða segja okkur brand­ara. Við gefum tækjum radd­skip­anir sem voru áður fram­kvæmdar með því að nota takka á snert­iskjá, mús eða lykla­borð. Öll sam­skipti okkar við Siri og vini hennar þurfa hins vegar að fara fram á ensku. Þegar ég spyr Siri hvort hún tali íslensku er svar hennar eft­ir­far­andi: „Hmm, I don’t have an answer for that, is there somet­hing else I can help you wit­h?” 

Tækni­fram­far­irnar eru hrað­ari en okkur grunar og erfitt er að segja til um hvert þró­unin leiðir okk­ur. Það eina sem er öruggt er að lífs­gæðin sem við búum við byggja á tækni­breyt­ing­um, mennt­un, rann­sóknum og nýsköp­un. Í öllum breyt­ingum fel­ast ógn­anir og tæki­færi. Ógn­an­irnar sem radd­stýr­ing tækja og tóla færir okkur snúa einna helst að áfram­hald­andi til­vist smærri tungu­mála. Tölvur og snjall­tæki skilja ekki íslensku og tungu­mál­inu okkar stafar hætta af þeirri stað­reynd. Tungu­mál sem ekki er not­hæft eða notað í því staf­ræna umhverfi sem verður sífellt stærri hluti dag­legs lífs okkar deyr svoköll­uðum staf­rænum dauða. 

Mál­tækni tryggir að tölvur skilji íslensku 

Mál­tækni vísar til sam­tvinn­unar tungu­máls og tölvu­tækni í hag­nýtum til­gangi. Mál­tækni bein­ist að því að þróa kerfi sem geta unnið með og skilið tungu­mál, og stuðla að notkun þeirra í sam­skiptum manns, tölvu og ann­arra tækja sem byggja á staf­rænni tækni. Mark­mið mál­tækni­á­ætl­unar er að tryggja að við getum og munum nota íslensku í sam­skiptum við – og í gegnum – staf­ræn tæki og tölv­ur. Áætl­unin er sam­starfs­verk­efni háskóla­sam­fé­lags­ins, stjórn­valda og atvinnu­lífs en haustið 2019 gerðu Almannaróm­ur, sem er mið­stöð mál­tækni, og rann­sókn­ar­hóp­ur­inn Sam­starf um íslenska mál­tækni (SÍM) samn­ing um smíði inn­viða í mál­tækni fyrir íslensku. Að SÍM standa níu lög­að­ilar – rann­sak­endur úr háskóla­sam­fé­lag­inu, opin­berar stofn­anir og frum­kvöðlar úr atvinnu­líf­in­u. 

Radd­stýr­ing tækja og tóla færir okkur fjöld­ann allan af tæki­færum sem geta bætt líf okkar og gert dag­legar athafnir ein­fald­ari, fljót­legri og jafn­vel ódýr­ari. Afrakstur fyrsta verk­efn­is­árs mál­tækni­á­ætl­unar liggur nú fyrir og er ljóst að við erum á góðri leið með að tryggja fram­tíð móð­ur­máls­ins í staf­rænum heimi. Ef fram heldur sem horfir er eng­inn vafi á því að tæki­færin í radd­stýr­ingu tækja eru fleiri en ógn­an­irn­ar. 

Mikið vatn runnið til sjávar á fyrsta ári mál­tækni­á­ætl­un­ar 

Á fyrsta ári mál­tækni­á­ætl­unar vann rann­sókn­ar- og þró­un­ar­hóp­ur­inn SÍM að 34 verk­efn­um. Meg­in­á­hersla var lögð á gagna­söfn, bæði texta og tal, enda byggir allur mál­tækni­hug­bún­aður á gögnum um tungu­mál­ið. Meðal gagna­safna sem unnið var að á árinu má nefna upp­færða útgáfu íslenskrar Risa­mál­heild­ar, sem er nýtt í öllum kjarna­verk­efn­um, m.a. til að hug­bún­aður geti lært eðli­legt mál­far, stór texta­söfn á íslensku og ensku til þess að þjálfa þýð­ing­ar­vél­ar, texta­safn og grein­ingar á staf­setn­ingu og mál­fari til þró­unar á mál­rýni­hug­bún­aði og vand­aðar upp­tökur á tali til þró­unar tal­gervla.

Auglýsing
Jafnframt voru þró­aðar frum­gerðir nokk­urra kjarna­lausna sem leggja grunn­inn að þeim bún­aði sem gef­inn verður út við lok mál­tækni­á­ætl­un­ar. Tölu­verð vinna var lögð í þróun á hug­bún­aði til grunn­grein­ingar á texta og tali. Þá hefur traustur grunnur verður lagður að vél­þýð­inga­kerfi sem þýðir á milli íslensku og ensku, sem og mál­rýni fyrir íslensku sem leið­beinir við texta­skrif.

Lands­mönnum þykir vænt um tungu­málið og vilja leggja sitt af mörkum til varð­veislu þess. Það sést á fram­lag­inu til söfn­unar radda í gegnum vef­inn Sam­róm­ur.is, sem Almannarómur og Háskól­inn í Reykja­vík standa að í sam­ein­ingu. Radd­gagna­safnið Sam­rómur verður notað til þjálf­unar mál­tækni­hug­bún­aðar fyrir íslensku. Nú þegar hafa um 12 þús­und ein­stak­lingar lesið rúm­lega 27 þús­und mín­út­ur, eða tæp­lega 319 þús­und setn­ing­ar, inn á Sam­róm. Til að tryggja að tækin skilji alla er brýnt að safna röddum sem flestra; fólks á öllum aldri, af öllum kynj­um, hvaðanæva af land­inu og með sem fjöl­breyttastan fram­burð. Sér­stök áhersla er lögð á söfnun radda barna og ung­linga en án radda þeirra munu tækin ekki skilja radd­skip­anir og sam­ræður þeirra á íslensku, þannig að þau þyrftu að halda áfram að tala ensku við sím­ana sína. Fram­tíð íslensk­unnar er því bók­staf­lega í hendi þeirra. 

Nýverið gaf sprota­fyr­ir­tækið Mið­eind út smá­forritið Emblu. Embla er fyrsta raddappið sem skilur og talar íslensku en það byggir á ýmsum afurðum mál­tækni­á­ætl­un­ar. Hægt er að spyrja Emblu um tíma­setn­ingar stræt­ó­ferða, opn­un­ar­tíma sund­lauga, landa­fræði, klukk­una og frétt­ir. Og þegar ég bað Emblu um að segja mér brand­ara þá sagði hún mér þenn­an: „Af hverju læð­ast Hafn­firð­ingar alltaf fram hjá apó­tek­um? Til að vekja ekki svefn­pill­urn­ar.“

Þetta er ekki fyndn­asti brand­ari sem ég hef heyrt, en hann er að minnsta kosti á íslensku. Staf­ræn fram­tíð móð­ur­máls­ins okkar felst í notkun þess á sem flestum sviðum dag­legs lífs, líka til að segja lélega brand­ara.

Höf­undur er fram­kvæmda­stjóri Almannaróms – Mið­stöðvar mál­tækni.

Almannarómur er mið­stöð mál­tækni og ber ábyrgð á fram­kvæmd mál­tækni­á­ætl­unar fyrir íslensku. Mark­mið mál­tækni­á­ætl­unar er að vernda íslenska tungu, með því að tryggja að við getum og munum nota íslensku í sam­skiptum við og í gegnum staf­ræn tæki og tölv­ur. Rann­sókn­ar- og þró­un­ar­hóp­ur­inn SÍM (Sam­starf um íslenska mál­tækni) vinnur nú að smíði og þróun inn­viða fyrir íslenska mál­tækni.

Rann­sókna- og þró­un­ar­hóp­ur­inn SÍM (Sam­starf um íslenska mál­tækni) sér um fyrsta stig gagna­söfn­unar og mótun svo­kall­aðra kjarna­lausna í sam­ræmi við samn­ing Almannaróms við SÍM. Að SÍM standa tíu lög­að­ilar – rann­sak­endur úr háskóla­sam­fé­lag­inu, opin­berar stofn­anir og frum­kvöðlar úr atvinnu­líf­inu: Háskóli Íslands, Háskól­inn í Reykja­vík, Stofnun Árna Magn­ús­sonar í íslenskum fræð­um, Blindra­fé­lag­ið, Rík­is­út­varp­ið, Credit­info Fjöl­miðla­vaktin ehf., Gamma­tek ehf., Mið­eind ehf., Hljóð­bóka­safnið og Tiro ehf.

Við þurfum á þínu framlagi að halda

Þú getur tekið beinan þátt í að halda úti öflugum fjölmiðli.

Við sem vinnum á ritstjórn Kjarnans viljum hvetja þig til að vera með okkur í liði og leggja okkar góða fjölmiðli til mánaðarlegt framlag svo við getum haldið áfram að vinna fyrir lesendur, fyrir fólkið í landinu.

Kjarninn varð níu ára í sumar. Þegar hann hóf að taka við frjálsum framlögum þá varð slagorðið „Frjáls fjölmiðill fyrir andvirði kaffibolla“ til og lesendur voru hvattir til að leggja fram í það minnsta upphæð eins kaffibolla á mánuði.

Mikið vatn hefur runnið til sjávar á þeim níu árum sem Kjarninn hefur lifað. Í huga okkar á Kjarnanum hefur þörfin fyrir fjölmiðla sem veita raunverulegt aðhald og taka hlutverk sitt alvarlega aukist til muna.

Við trúum því að Kjarninn skipti máli fyrir samfélagið.

Við trúum því að sjálfstæð og vönduð blaðamennska skipti máli.

Ef þú trúir því sama þá endilega hugsaðu hvort Kjarninn er ekki allavega nokkurra kaffibolla virði á mánuði.

Vertu með okkur í liði. Þitt framlag skiptir máli.

Ritstjórn Kjarnans: Sunna Ósk Logadóttir, Þórður Snær Júlíusson, Erla María Markúsdóttir, Arnar Þór Ingólfsson, Eyrún Magnúsdóttir og Grétar Þór Sigurðsson.


Já takk, ég vil styrkja Kjarnann!
Þorbjörn Guðmundsson
Er íslenska velferðarkerfið ekki lengur griðarstaður þeirra sem minnst hafa?
Kjarninn 11. janúar 2023
Takk fyrir og sjáumst á nýjum miðli á föstudag
Bréf frá ritstjóra Kjarnans vegna sameiningar við Stundina og þess að nýr framsækinn fréttamiðill verður til í lok viku.
Kjarninn 11. janúar 2023
Sverrir Albertsson
Vatn á myllu kölska
Kjarninn 11. janúar 2023
Lögreglumenn standa vörð um gröfurnar í námunni.
Berjast fyrir þorpi á barmi hengiflugs
Lítið þorp í Rínarlöndum Þýskalands er allt komið í eigu kolarisa. Fyrirtækið ætlar sér að mylja niður húsin og stækka kolanámu sína sem þegar þekur um 80 ferkílómetra. Þetta þykir mörgum skjóta skökku við í heimi sem berst við loftslagsbreytingar.
Kjarninn 10. janúar 2023
Arnþrúður Karlsdóttir, útvarpsstjóri Útvarps Sögu.
Útvarp Saga telur fjölmiðlastyrki skapa tortryggni og bjóða upp á frændhygli
Fjögur fjölmiðlafyrirtæki hafa til þessa skilað inn umsögnum um frumvarp Lilju Alfreðsdóttur menningar- og viðskiptaráðherra, sem mun að óbreyttu framlengja núverandi styrkjakerfi til fjölmiðla.
Kjarninn 10. janúar 2023
Sólveig Anna Jónsdóttir formaður Eflingar.
Viðræðum slitið og Efling undirbýr verkfallsaðgerðir
Samtök atvinnulífsins hafa hafnað gagntilboði Eflingar um skammtímakjarasamning, sem kvað á um meiri launahækkanir en SA hefur samið um við aðra hópa á almennum vinnumarkaði til þessa. Efling undirbýr nú verkfallsaðgerðir.
Kjarninn 10. janúar 2023
Palestínski fáninn á lofti í mótmælum í Reykjavík. Ísraelskri lögreglu hefur nú verið fyrirskipað að rífa fánann niður á almannafæri.
Fánabann og refsiaðgerðir í Palestínu í kjölfar niðurstöðu Sameinuðu þjóðanna
Degi eftir að ný ríkisstjórn tók við völdum í Ísrael samþykkti allsherjarþing Sþ að fela Alþjóðadómstólnum í Haag að meta lögmæti hernáms Ísraelsríkis á Vesturbakkanum. Síðan þá hefur stjórnin gripið til refsiaðgerða og nú síðast fánabanns.
Kjarninn 10. janúar 2023
Gríðarlega mikil dæling á sandi á sér stað í Landeyjahöfn á hverju ári. Markarfljótið ber hundruð þúsunda tonna af jarðefnum út í sjó og það á til að safnast upp í mynni hafnarinnar.
Vilja sjúga sand af hafsbotni í stórum stíl og flytja út
Eftirspurn eftir íslenskum jarðefnum er gríðarleg ef marka má framkomin áform erlendra stórfyrirtækja um nýtingu þeirra. Vinsældir hafnarinnar í Þorlákshöfn eru samhliða mjög miklar.
Kjarninn 10. janúar 2023
Meira úr sama flokkiAðsendar greinar