Suomessa aletaan kehittää nykyistä paremmin toimivaa suomenkielistä tekoälyä ja puheentunnistusta, jonka pitäisi ymmärtää myös murteita. Tämän takia Valtion kehitysyhtiön Vake, Helsingin yliopisto ja Yle aloittivat tänään tiistaina kampanjan, jonka tavoitteena on kerätä 10 000 tunnin puhepankki. Puheet pankkiin voi lahjoittaa kuka tahansa suomalainen.
Toimivan suomenkielisen puheentunnistuksen luvataan helpottavan kaikkien suomalaisten arkea, vahvistavan suomen kielen asemaa erilaisissa sähköisissä palveluissa ja antavan yrityksille mahdollisuuden tarjota parempaa palvelua sähköisillä alustoilla.
Ohjelman kehittämiseen tarvitaan 10 000 tuntia vapaasti puhuttua suomen kieltä. Sitä tarvitaan eri-ikäisiltä, eri tavoin suomea puhuvilta ja eri murrealueilta.
Hankkeen kuvataan vastaavan suuruusluokaltaan Kalevalan tai kansanrunouskokoelman aineistojen keruuta. Jos 10 000 tunnin puhepankki saadaan kokoon, se on kuin kirjasto tutkijoitten käyttöön. Tähän asti heillä on ollut käytettävissään korkeintaan muutamia yksittäisiä kirjoja.
Käytännössä puhetta lahjoitetaan puheenlahjoituskoneella , jossa on tarjolla erilaisia aihealueita. Puheenlahjoituskone toimii mobiilisovelluksella.
– Tietääksemme tämä Suomessa tehtävä työ pienten kielten tukemiseksi digitaalisessa maailmassa on ainutlaatuista, ja onkin herättänyt huomiota Euroopan komissiota myöten, Vaken ohjelmajohtaja Pia Erkinheimo kertoo hankkeen tiedotteessa.
Ylen internetkehityksen palvelupäällikön Aleksi Rossin mukaan pienellä kielialueella ei voi olettaa kansainvälisten teknologiajättien yksin huolehtivan suomen kielen toimivuudesta tulevaisuuden teknologioissa.
– Mitä enemmän ja monipuolisemmin puhetta saadaan kerättyä, sitä paremman puheentunnistuksen saamme luotua ja sitä helpompaa jatkossa on asiointi erilaisissa sähköisissä palveluissa.
Hankkeessa puheella tarkoitetaan arkikielellä puhuttua normaalia puhetta kaikkine takelteluineen, epäröimisineen ja normaaline taukoineen.