Timo Tarmio

Suomen kielen digitalisaatio ei tarvitse Jungner-suomea

Kieli ja tietokoneistumisen haaste olivat Mikael Jungnerin omien täsmennysten mukaan aiheena hänen puhuessa suomen kielen käyttäjien ”kielitaakasta”. Jungner nosti pöydälle ajankohtaisen aiheen, kielen teknologisoitumisen ja sen seuraukset ja vaatimukset.

Kieli on ollut aina teknologiaa. Alkujaan sormen ja sen jälkeen puheen voimin, sitten kynän, kirjoitustaidon ja kirjapainon tehostamana kieli kuljetettiin omaan aikaamme, jossa teknologisoitu kieli on digitalisaation voimistamana yhteiskunnan muutosmoottori vahvemmin kuin koskaan aikaisemmin.

Luonnollista ihmisten käyttökieltä ymmärtävä, suoltava ja jakava tietokoneellistettu kieli on digitaalisen ympäristömme keskeisin kulttuurinen vaikuttaja.

Tämä teknologisoitu kieli on uuden talouden tunnustettu voimanlähde. Tätäkin oleellisempaa on, että se kykenee heittämään eteemme perinteistä mediatietoa pilkkaavina yllätyksinä brexitit ja trumpit – ja tämä on vasta alkua. Teknologisoitu kieli vie maailmaa mukanaan. Kieli myös elää ja muuttuu tässä ympäristössä.

 

Onko suomen kieli kulkenut Jungnerin väitteen mukaisesti digitalisaatiossa ja kielen automatisoidussa eli tietokoneellistetussa tunnistamisessa jälkijunassa? Ei. Suomen kieltä tai kielioppia ei tämän tähden tarvitse aktiivisesti sormeilla.

Suomalaisprofessoreiden Fred Karlssonin ja Kimmo Koskenniemen innovaatiot toivat 1980-luvun alussa luonnollisen ihmiskielen tietokoneen kieleksi ja koneen ymmärryksen ulottuville.

Koskenniemen ns. kaksitasomorfologia ratkaisi sanojen taivutusta koskeneet ongelmat – ei vain suomen kielen osalta vaan kaikkia kieliä koskien. Malli on yleispätevyydessään yhä ylittämätön.

Maailmanluokan innovaatioillaan suomalaistutkijat liikkuivat digitalisaation ja uuden talouden syntymailla jo silloin, kun suuresta murroksesta oli olemassa vain enne ja lupaus. Piilaakson pioneerit, Xeroxin PARC-tutkimuskeskuksen tutkijat, oivallus ohjasi myös uusille urille.

Uuden talouden nykyiset maailmanvaliot – Google, Amazon, Apple, IBM, Microsoft, Facebook – ovat kaikki kielellisen tietokoneistetun analyysin, kääntämisen ja sisällön tunnistamisen, lajittelun sekä tiedon levittämisen kaupallisia osaajia.

Tämä on myös Karlssonin ja Koskenniemen perustaman suomalaisen Lingsoft Oy:n maailma. Käytännössä jokainen tietokoneenkäyttäjä on törmännyt Lingsoftin kädenjälkeen, esimerkiksi Microsoft Office -tuoteperheen Word-dokumenteissa punaisina ja vihreinä virheen osoittavina merkintöinä. Sanat taipuvat, ja kone osaa niiden taivutuksen myös suomeksi!

 

Monikielisyys on tärkeä rikkaus

Karlssonin ja Koskenniemen varhaisten tutkimuksen taustalla oli havainto englannin yksinkertaistavasta kielikuvasta. Kielen tutkimus oli jäämässä valtakielestä nousevan kysymysasettelun vangiksi.

Kielellinen yksipuolisuus ulottuu myös maailmankuvan rakennuspalikoihin. Kielikirjon rikkaus on myös ajattelun rikkautta. Jungner varmasti muistaa kuuluisan Apple-kampanjan, joka korosti monimuotoisuuden arvoja samassa asussa ja tahdissa liikkuvaan yhdenmukaistavaan PC-armeijaan nähden.

Tästä on kielessäkin kyse. Kielellinen monimuotoisuus säilyttää omalla tavallaan yhteiskunnan elinvoimaisuutta ylläpitävää muutosdynamiikkaa. Globaalissa maailmassa ponnistelut kielikirjon säilyttämiseksi ja kielten digitaalisen sukupuuton ehkäisemiseksi eivät ole vain kansallista itsekkyyttä vaan lupaus paremmasta.

Parhaillaan yleistyvien puhekäyttöliittymien taustateknologia edellyttää vaativaa osaamista. Puhuttua suomea ymmärtäviä ja tuottavia sovelluksia on Suomessa rakennettu jo vuosikymmeniä.

Digitaalisen talouden globaaleista jako-osuuksista taistellessaan kansainväliset suurtoimijat eivät panosta pieniin kieliin. Esimerkiksi Microsoftin Cortana-järjestelmä pyrkii puheena ymmärtämään vain 13:a valtakieltä. Suomi ei ole sen enempää kielenä kuin alueenakaan valittujen joukossa.

Piditkö tästä kirjoituksesta? Näytä se!

3Suosittele

3 käyttäjää suosittelee tätä kirjoitusta. - Näytä suosittelijat

NäytäPiilota kommentit (2 kommenttia)

Käyttäjän jgagarin56 kuva
Juha Kuikka

Jungner on todellakin fundamentaalisen väärässä niin siinä mitä tulee suomen kieleen kuin myös siinä mikä teknologian rooli ja tarkoitus maailmassa on.

Teknologian ja digitalisaation on määrä palvella ihmistä eikä päinvastoin. Jos joku asia ihmiselämässä ei sovi digitalisaatioon, niin sitten digitalisaatiotekniikkaa muutetaan vastaavasti - ei päinvastoin.

Kiinan kielessä on yli 20.000 kirjainmerkkiä ja niillä kiinalaiset tekstailevat, kirjoittelevat meilejä ja surffailevat netissä. No problem!

Käyttäjän CarolusLinden kuva
Carolus Linden

Hyvä, että Lingsoftin olemassaolo, toiminta ja merkitys näin saadaan yleisempään tietoisuuteen. Kirjoitus on muutenkin huomionarvoinen.