Kuinka tekoäly ja suomen kieli toimivat yhdessä?

tekoäly ja suomen kieli

Tekoäly on nykyään jo melko paljon käytetty teknologian muoto. Sitä käytetään niin kielellisen sisällön tuottamiseen kuin muuhunkin. Tekoälyllä voidaan luoda tekstin ohella myös koodia, kuvia tai jopa musiikkia. Se on teknologia, jonka käyttö on vielä muovautumassa ja monet vasta kokeilevat, mihin kaikkeen sitä voisi käyttää.

Tekoälyllä pystytään tuottamaan sisältöä eri kielillä. Niinpä sitä voi käyttää myös suomeksi, jolloin se tuottaa sisältöä suomeksi. Mutta miten on kielitaidon laita? Miten hyvin ja taitavasti tekoäly pystyy tuottamaan aidosti suomenkielistä sisältöä?

Tämä voidaan laittaa testiin monenlaisten tekoälysovellusten kautta. Esimerkiksi ChatGPT ja vaikkapa Snapchatistakin löytyvä My AI -botti pystyy vastaamaan erilaisiin tarpeisiin. Mutta voiko lopputuloksesta tunnistaa, että se on tehty tekoälyllä?

Suomen kielen erityispiirteet ja haasteet

Suomen kieli tunnetaan yhtenä maailman vaikeimmista kielistä, sillä sen oppimiseen liit tyy paljon monimutkaisia taivutusjärjestelmiä ja sääntöjä. Tekoäly pystyy huomioimaan tällaiset asiat, mutta tietyissä tilanteissa saattaa olla selkeää, että kyseessä on botin tuottama teksti.

Esimerkiksi asiakaspalveluboteista yleensä huomaa, että kyseessä ei ole todellinen ihminen. Kieliasu sinällään on yleensä hyvää tai täydellistä, mutta siitä puuttuu luonnollisesti inhimillisyys. Esimerkiksi moni suomalainen nettikasino tarjoaa asiakaspalvelun chatin kautta. Chatissa asiakasta saattaa aluksi palvella botti. Tämän voi havaita jo asiakaspalvelun lähettämien viestien tyylistä ja sävystä. Botit eivät myöskään aina ymmärrä kirjoitettua lausetta.

Suomessa sanoja on mahdollista muodostaa johtamalla muista sanoista. Tämä tekee kielestä entistä monimutkaisemman ja tuo kieleen lähes loputtoman määrän variantteja. Myös yhdyssanoja on paljon, joka taas eroaa esimerkiksi englannista.

Suomen kielioppi tuottaa toisinaan vaivaa jo suomalaisille, saati sitten tekoälylle. Vaikka tekoälyä pidetäänkin virheitä tekemättömänä tietokoneena, ei se kuitenkaan ole virheetön. Niinpä tekoälyllä luotu teksti kannattaa aina tarkistaa vielä ihmisen toimesta.

Suomen kieli ja datan valtameri

Koska suomen kieli on monimutkainen ja siihen liittyy paljon erilaisia kielioppisääntöjä, mukaanlukien murteet, yhdyssanat ja poikkeussäännöt, vie suomi kaikkine sääntöineen valtavan määrän dataa. Tällaista dataa ei myöskään ole saatavilla niin laajalti kuin esimerkiksi englannista, joka on maailmalla huomattavasti suomea yleisemmin käytetty kieli.

Suomen kielen puutoksen saattaa huomata monissa eri palveluissa, joissa sovellus tai ohjelma on saatavilla englanniksi, muttei ainakaan toistaiseksi suomeksi. Tämä on ilmennyt erilaisissa tekoälysovelluksissa, kuten Replika, jokatoimii englanniksi. Mikäli eri sovellusten tarjoajat haluaisivat tarjota mahdollisuuden kaikkien kielten käyttöön, veisi tämä aivan valtavasti dataa. Tämä on syynä sille, miksi niin moni tekoälypalvelu ei ole käytettävissä suomeksi.

Tekoälyn kehitys

Tekoälyä halutaan kehittää jatkuvasti laadukkaampaan suuntaan ja sen kielellistä taitoa halutaan kehittää mahdollisimman luonnolliseksi. Esimerkiksi suomen kielelle kehitettyjä tekoälysovelluksia halutaan parantaa jatkuvasti. Näin sovellus sekä tunnistaisi puhuttua ja kirjoitettua suomen kieltä että tuottaisi sitä luonnollisemmin.

Äänikomentoja on ollut käytössä jo pitkään, mutta nykyään kyseistä teknologiaa löytyy jo autoistakin. Kuljettaja voi esimerkiksi antaa autolleen äänikomennon laittaa musiikkia soimaan. Autossa olevan tietokoneen tulisi pystyä tunnistamaan äänikomento virheettömästi ja toteuttaa juuri pyydetty komento. Tätä kehitetään jatkuvasti käyttämällä hyödyksi aitojen suomalaisten tuottamaa puhetta.

Suomalaisten tuottaman puheen käyttö kehitystyöhön parantaa sovellusten toimivuutta esimerkiksi silloin, kun puhuja käyttää esimerkiksi erikoisempaa äänensävyä tai hänen puheessaan on havaittavissa murre. Suomessa on käytössä paljon erilaisia murteita ja tarkoitus olisi, että tekoäly toimisi yhtä lailla kaikille, ei vain rajatusti kirjakieltä puhuville.

Inhimillinen kommunikointi

Siinä, missä suomalainen heittää sujuvasti suomalaisia sanontoja ja sananlaskuja keskusteluun, tekoäly ei yleensä toimi näin – ellei sitä erikseen pyydä. Tällöinkin havaittavissa on tietynlainen luonnottomuus. Eihän tekoäly ole suomalainen henkilö. Suomalaiseen kielenkäyttöön liittyy tietynlainen, suomalaisille ominainen luonne ja luontaisuus. Tämä tuo haasteita tekoälylle, joka pysty luomaan sisältöä vain tietokantojen mukaan.

Tekoälyä kehitetään jatkuvasti ja sitä muutama vuosi sitten ensi kertaa kokeilleet huomaavat varmasti eron tämän päivän tekoälysovelluksiin verrattuna. Luonnollisuuteen on kuitenkin vielä hyvin paljon matkaa.

Toisaalta, jos mietitään tekoälyä, ei sen liene olla tarkoituskaan luonnollinen. Tekoäly on hyvä ja tehokas työkalu kaikenlaisen sisällön tuottamiseen tai tiedon hankkimiseen, mutta se, voiko se edes tulevaisuudessa ilmaista itseään täysin suomalaiseen tapaan, taitaen kaikki kielemme koukerot, jää nähtäväksi.

Jaa tämä artikkeli