Margmála evrópskt máltæknisamstarf

Um höfundinn
Eiríkur Rögnvaldsson

Eiríkur Rögnvaldsson

Eiríkur Rögnvaldsson er prófessor emeritus í íslenskri málfræði. Undanfarin ár hefur hann einkum fengist við máltækni en hefur einnig stundað rannsóknir í samtímalegri og sögulegri setningafræði, svo og orðhlutafræði og hljóðkerfisfræði. Sjá nánar

David Hasselhoff talaði við bílinn sinn í sjónvarpsþáttunum Knight Rider og reyndist þar langt á undan sinni samtíð. En nú færist í vöxt að mannlegt mál sé notað til að stjórna ýmsum tölvustýrðum tækjum, bílum þar á meðal.
David Hasselhoff talaði við bíl í sjónvarpsþáttunum Knight Rider og reyndist þar langt á undan sinni samtíð. Nú færist í vöxt að mannlegt mál sé notað til að stjórna ýmsum tölvustýrðum tækjum, bílum þar á meðal.

Máltæknisetur (e. Icelandic Centre for Language Technology, ICLT) var stofnað árið 2005 sem samstarfsvettvangur Háskóla Íslands, Háskólans í Reykjavík og Stofnunar Árna Magnússonar í íslenskum fræðum um rannsókna- og þróunarstarf á sviði máltækni (tungutækni, e. language technology). Nýlega hefur setrið jafnframt verið  gert að stofu innan Málvísindastofnunar Háskólans. Eitt mikilvægasta verkefni þess er að kynna máltækni og auka skilning á möguleikum hennar og sívaxandi mikilvægi í upplýsingaþjóðfélaginu. Margvíslegar upplýsingar þar að lútandi er að finna á heimasíðu setursins (http://maltaeknisetur.is) og þar er einnig vísað á ýmsar greinar um íslenska máltækni. Nú er enn fremur unnið að gerð samræmdra máltækniskýrslna (e. language whitepapers) fyrir opinber mál flestra Evrópulanda (þátttökulanda í META-NET, sjá hér á eftir) og eiga þær að vera tilbúnar í lok maí. Hver skýrsla verður gefin út bæði á ensku og því máli sem hún fjallar um. Íslenska skýrslan verður aðgengileg á heimasíðu Máltækniseturs um leið og hún er tilbúin, og þar verður einnig að finna margs konar fróðlegar upplýsingar um almenna og íslenska máltækni.

Máltækni felst í samþættingu tungumáls og tölvutækni og sú samþætting hefur ýmsar hliðar. Þannig má nota tölvutæknina til að hjálpa okkur á ýmsan hátt við meðferð og beitingu tungumálsins. Þar má nefna hugbúnað sem leiðréttir stafsetningu og málfar, vélrænar þýðingar, rafrænar orðabækur, kennsluhugbúnað og ýmislegt fleira. Á hinn bóginn má einnig snúa þessu við og nota tungumálið til að auðvelda hagnýtingu og beislun tækninnar. Þannig færist í vöxt að mannlegt mál sé notað til að stjórna ýmsum tölvustýrðum tækjum, allt frá heimilistækjum til bíla. Í ýmiss konar þjónustuverum og upplýsingaveitum erlendis er nú algengt að tölva tengd talgreini túlki fyrirspurn notanda, leiti svars við henni í gagnabanka, semji svar og komi því til notandans með aðstoð talgervils. Möguleikar máltækni til hjálpar fólki með ýmiss konar fötlun eru einnig gífurlegir. Blindir, sjónskertir og lesblindir hafa t.d. ómetanlegt gagn af talgervlum, og talgreining er himnasending fyrir hreyfihamlaða sem eiga erfitt með að nota hendurnar til að stjórna tækjum eða slá inn texta.

Þróun máltæknibúnaðar er mjög dýr og kostnaðurinn er óháður fjölda málnotenda. Því er skiljanlegt að máltækni hafi átt erfitt uppdráttar á Íslandi – smæð markaðarins gerir það að verkum að fyrirtæki sjá sér ekki hag í því að leggja í mikinn þróunarkostnað sem lítil von er um að ná til baka. Það hefur hins vegar sýnt sig, bæði hér á landi og erlendis, að þekkingu og skilningi á máltækni og möguleikum hennar er verulega ábótavant, bæði hjá almenningi, fyrirtækjum og opinberum aðilum. Með vitundarvakningu á þessu sviði kæmu kröfur um íslenskan máltæknibúnað án efa frá fleiri hópum og yrðu bornar fram með meiri þunga. Þar með ykjust möguleikar á arðvænlegu þróunarstarfi á þessu sviði og jafnframt líkur á að íslensk fyrirtæki færu að sinna því. Það er enginn vafi á því að þörf íslenskra málnotenda og íslensks málsamfélags fyrir máltækni er jafnmikil og gerist í öðrum tæknivæddum nútímasamfélögum. Verði henni ekki mætt með íslenskum máltæknibúnaði eru líkur á að enskan ryðji sér til rúms á sífellt fleiri sviðum daglegs lífs. Þess vegna er lögð áhersla á það í íslenskri málstefnu sem Alþingi samþykkti fyrir tveimur árum að mikilvægt sé að vinna að þróun íslensks máltæknibúnaðar.

Merki Máltækniseturs
Merki Máltækniseturs

Máltæknisetur tekur nú þátt í verkefninu META-NORD ásamt öðrum Norðurlandaþjóðum og Eystrasaltsþjóðum. Þetta er tveggja ára verkefni sem hófst 1. febrúar sl. og er hluti af stærra verkefni, META-NET, sem tekur til allra ríkja Evrópusambandsins og tengdra ríkja. Verkefnin eru styrkt af 7. rammaáætlun Evrópusambandsins og stefnumótunaráætlun sambandsins á sviði upplýsingatækni (ICT Policy Programme), en hlutur Máltækniseturs af styrknum er um 202 þúsund evrur. META-NET og útvíkkun þess, tengslanetið META (Multilingual Europe Technology Alliance), hafa það að markmiði að skapa tæknilegar forsendur fyrir margmála upplýsingasamfélagi í Evrópu þar sem allir geti notað móðurmál sitt við öflun og úrvinnslu hvers kyns upplýsinga. Þetta á að gera með því að efla máltækni fyrir allar þjóðtungur álfunnar og auðvelda tengsl milli þeirra með uppbyggingu margmála auðlinda (e. language resources, s.s. textasafna, orðasafna og hugbúnaðar) sem nýst geti í margvíslegum máltækniverkefnum. Ekki er ætlunin að koma slíkum auðlindum upp frá grunni, heldur ljúka við verk sem eru í vinnslu, staðla þau og gera aðgengileg í gagnabrunninum META-SHARE. Með því að greiða leið milli tungumála og auðvelda mönnum að nota móðurmál sitt í fjölþjóðlegum samskiptum má koma í veg fyrir að enskan þrengi sér smátt og smátt inn á fleiri svið á kostnað þjóðtungna en varðveita þess í stað margmála evrópskt samfélag.


Comments

Leave a Reply

Your email address will not be published. Required fields are marked *