Um skilning tölvunnar á tungumálinu – ný þróun innan vélþýðinga

Árið 2014 kom út fyrsta vísindagreinin um tauganets vélþýðingar. Síðan þá hefur orðið gífurleg breyting í vélþýðingageiranum bæði innan iðnaðarins og innan akademíunnar. Tauganets vélþýðingar gefa betri niðurstöðu í prófunum almennt heldur en hinar gömlu tölfræðilegu vélþýðingar gerðu nokkurn tímann. Hjá Google gerðust menn svo bjartsýnir að þeir gáfu út fræga vísindagrein sem heitir Bilið brúað á milli mannþýðinga og vélþýðinga – Google´s Neural Machine Translation Bridging the gap between Human and Machine translation. Eitthvað virðist nú samt vera farið að draga úr bjartsýninni strax núna árið 2018, því í ljós kom við nánari rannsóknir að villur eru algengar hjá nýju vélþýðingakerfunum líka. Textinn virðist flæða betur í vélþýðingunum, en villurnar geta verið lúmskari og erfiðara að finna þær. Þannig virðist textinn vera betri við fyrstu sýn, en er það ekki alltaf þegar kafað er ofan í hann. Google translate fyrir íslensku er orðið tauganetskerfi, Systran er líka tauganetskerfi og flest vélþýðingakerfi sem eru í boði á markaðnum í dag eru byggð á tauganetum sem margfalda saman vektora í jafnvel 500 víddum samtímis. Vélþýðingar duga þó ágætlega til að skilja innihald texta í grófum dráttum, en sú staða hefur verið uppi í nokkuð mörg ár.

Mannfræðingar hafa löngum sagt að tungumálið og hin flóknu samskipti þess, séu það sem helst aðgreinir mannskepnuna frá öðrum dýrategundum. Þekking á tungumálinu flokkast undir almenna vitsmunagreind og er tungumálið eitt það fyrsta sem við reynum að læra á lífsleiðinni. En þar liggur einmitt flöskuhálsinn. General Artificial Intelligence eða almenn gervigreind er ennþá ekki sýnileg við sjóndeildarhringinn. Sumir segja að það sé rangt að ræða um gervigreind yfirhöfuð þar sem gervigreind hafi ekki enn neina raunverulega greind. Á meðan gervitauganet geta einungis lesið eina setningu í einu. Á meðan þau skilja ekki samhengi, menningu, jafnvel heimsmynd þess texta sem þau eru að vinna úr má reikna með að niðurstöður vélþýðinga verði ætíð takmarkaðar. Mannlegir þýðendur geta því andað léttar enn um sinn. Það er ekki búið að leysa vandamál almennrar gervigreindar og á meðan tölvur hafa ekki almenna skynsemi, er engin ástæða til að hafa of miklar áhyggjur af því að þær leysi hinn mannlega þýðanda endanlega af hólmi.

Um höfundinn

Ingibjörg Elsa Björnsdóttir

Ingibjörg Elsa Björnsdóttir er þýðandi og umhverfisfræðingur. Hún er í doktorsnámi í þýðingafræði við Háskóla Íslands. Sjá nánar

[fblike]

Deila