top of page

Miten AI muuttaa kieltä?

  • 15.7.2024
  • 6 min käytetty lukemiseen

Päivitetty: 14.11.2024

Arkistojen selailu, mukaan lukien Kopeekan arkistot, on mielenkiintoista puuhaa. Joidenkin vanhempien kollegoidemme ajatukset muistuttavat nykyisiä tapahtumia, kun taas toiset osoittavat päinvastaista, näyttäen, että tulevaisuutta ei voi ennustaa etukäteen. Ja joistakin teksteistä voi löytää yksityiskohtia, jotka olivat mahdollisia vain tuolloin ja niissä olosuhteissa.



Näiden tekstien joukossa oli yksi yksinäinen anonyymi ääni, joka esitti kysymyksiä ja etsi vastauksia suuremmilta mieliltä. Esimerkiksi joulukuun 2009 numerossa ilmestyi otos Karl Jaspersin kirjasta "The Origin and Goal of History" ilman mitään lisäkommentteja kirjoittajalta.


“Tekniikka vähentää työn kustannuksia, mutta samalla lisää sen intensiteettiä. Tekniikka asettaa tehtäväkseen työn kustannusten vähentämisen. Ihmisen lihastyön tulisi korvata koneiden työ, jatkuva henkinen jännitys, laitteiden automatisointi. Jokainen suuri löytö vähentää lihasten ja ajattelun jännitystä”.

Aikamme ei voi antaa lopullista vastausta tähän mykkään kysymykseen, sillä historia on loppujen lopuksi prosessi ilman päätepistettä. Kuitenkin voimme jonkin verran jakaa palautetta sekä Jaspersin että nimettömän kirjoittajan kanssa.


Venäjän kieltä ja kielitiedettä käsittelevän Розенталь и Гильденстерн -podcastin uudessa kaudessa Helsingin ja Tukholman yliopiston lehtori Mikhail Kopotev kertoo kieliteknologioiden kehityksestä ja siitä, mihin suuntaan olemme niiden kanssa menossa:


Olen tutkinut tietokonelingvistiikkaa monta vuotta, ja tämä, mitä tapahtuu nyt, on suurin vallankumous, jonka olen nähnyt vuosikymmeniin. Ei ole sattumaa, että 1900-luvun suurin kielitieteilijä N. Chomsky esittää voimakasta kritiikkiä: 


“ChatGPT exhibits something like the banality of evil: plagiarism and apathy and obviation. It summarizes the standard arguments in the literature by a kind of super-autocomplete, refuses to take a stand on anything, pleads not merely ignorance but lack of intelligence and ultimately offers a “just following orders” defense, shifting responsibility to its creators”.


Viittaus Hannah Arendtin kirjaan ei ole sattumaa: ChatGPT tosiaan vain tottelee käskyjä. Mutta Chomsky on väärässä. Kielitiede, joka nyt tulee korvaamaan vanhan, osoittaa, että tiukat säännöt korvataan todennäköisyyksillä. Esimerkiksi venäjänkielinen sana "pulla" on feminiini lähes kaikissa tapauksissa. Mutta emme voi sulkea pois mahdollisuutta, että sanaa "pulla" käytetään maskuliinimuodossa, kuten vanhassa vitsissä yhdestä runoilijasta, joka kysyi kahvilassa "можно мне один кофе...", sai myönteisen vastauksen myyjältä ja jatkoi sitten "... и один булочка". Vallankumous, joka tapahtuu nyt, kertoo siitä, että kieli on järjestetty erittäin monimutkaisena joukkona todennäköisyyksiä, joihin vaikuttaa monia tekijöitä. Kieli on jatkuvasti monimutkainen valinta. Mitä tämä antaa meille käytännössä? Aloitamme työskennellä ei rajoitetujen kielten esimerkkien kanssa, kuten Chomsky tekee, vaan valtavan kielidatan kanssa.


Jos puhutaan siitä, miten teknologioiden kehitys ja suuret datamäärät, suuret kielimallit vaikuttavat kieleen, haluaisin korostaa muutamia asioita. Ensinnäkin kirjoitetut tekstit pian luodaan tietokoneen avulla, ja raja kirjoittajan ja hänen tietokoneavustajansa välillä hämärtyy. R. Barthesin julistama La mort de l'auteur vuonna 1967 toteutuu teknologisesti. Tulee epäselväksi, kuka luo tekstin — ihminen vai ohjelmamme avustaja? Tämä johtaa siihen, että hyvin kirjoitettuja tekstejä tulee enemmän, mutta niiden tekijyys hämärtyy. Käytännössä kuka tahansa, joka on jollakin kielellä kyennyt muotoilemaan ajatuksensa ja painamaan nappia editorissaan, saa upean tekstin.


- Mihail, tässä haluaisin pysähtyä hetkeksi kirjallisten tekstien äärelle ja heittää hieman skeptisen kommentin. Se, mistä puhutte, on tulevaisuuden asia, mutta jotain siitä näkyy jo nyt. Ennen kaikkea tämä toimii erittäin hyvin englanninkielisille teksteille, mutta venäjänkielisten tekstien tapauksessa, pelkään, että kaikki on vielä melko kömpelöä. Sama ChatGPT, joka tarjoaa vastauksia kysymyksiin eri muodoissa, tuntuu vielä minusta käsittelevän tyyliä ja jotain muutakin melko huolimattomasti.


Avainsana tässä on 'toistaiseksi'. Tietenkin tällä hetkellä tilanne on juuri sellainen. Näiden järjestelmien työn laatu riippuu suuresti syötetyn aineiston laadusta ja määrästä. Englanninkielisiä tekstejä on tietysti paljon. Mutta se leviää kohta varmasti myös muihin kieliin. Tässä valitettavasti kielet jakautuvat kahteen epätasa-arvoiseen ryhmään. Ensimmäiset ovat niitä kieliä, joille on riittävästi dataa, ja venäjä kuuluu ehdottomasti tähän joukkoon, se on kolmantena internetin edustavuudessa englannin ja espanjan jälkeen. Toinen ryhmä ovat kielet, joita on vähän internetissä, kuten suomi. Suomen kohdalla ei voi sanoa, että se olisi 'pieni': 5 miljoonaa asukasta, vahva asema Suomessa. Mutta verkossa suomenkielisiä tekstejä on huomattavasti vähemmän kuin venäjän- ja englanninkielisiä.


- Eikö tämä tarkoita jonkinlaista loppua koulutukselle? Nykyään esimerkiksi opiskelijat esittävät kurssi- ja lopputyönsä teksteinä, jotka on kirjoitettu keinoälyllä. Mutta niiden laatu on sellainen, että opettajalle ei ole erityisen vaikeaa ymmärtää, että niitä ei ole kirjoittanut opiskelija: ne on muotoiltu kömpelösti suurella määrällä virheitä ja outojen olemattomien termien kanssa. Mutta jos, kuten sanotte, tekstien laatu paranee ja koneen tuottamat tekstit ovat erottamattomia ihmisen tuotetuista teksteistä, eikö tämä tarkoita jonkinlaista loppua koulutukselle?


Jossain mielessä näin on. Ainoa tapa tarkistaa henkilön tietämys, hänen kykynsä ilmaista ajatuksensa ja käyttää tietoa, joka hänellä on päässään, on edelleen suljetussa tilassa tarkistus, niin, että opiskelijat kirjoittavat kynällä paperille tai vastaavat suullisesti.


Mutta jos katsotaan tätä laajemmin, niin me, opettajina, valmistelemme opiskelijoita todelliseen elämään, missä he istuvat tietokoneen ääressä hyödyntäen kaikkea sitä potentiaalia, jonka tarjoavat sekä Wikipedia että tekoäly, ja kaikki, mitä internetissä on. Mielestäni tehtävämme on opettaa heitä käyttämään näitä resursseja oikein.

Tekoälyjärjestelmät ovat periaatteessa toissijaisia. Juuri tästä syystä monet runojen kirjoittamisen kokeilut tekoälyllä y johtavat joko parodioihin tai yksinkertaisesti banaaliuteen. Koneoppimisalgoritmit on suunniteltu etsimään malleja, toistoja. Ne kykenevät erittäin hyvin paketoimaan sisällön, jonka tuomme niihin. Ja mielestäni opettajan tehtävä on opettaa opiskelijoita selkeästi ilmaisemaan ajatuksensa ja käyttämään tietokonetta tekstien tuottamisessa.


Mihin tämä johtaa? Näen muutamia seurauksia: yksi koulutuksen, toinen pikemminkin yhteiskunnan kannalta. Uskon, että olemme kynnyksellä koulutuksen yksilöllistämiseen. Tunnettu pedagogi Ken Robinson käytti puolet elämästään kritisoidakseen nykyistä järjestelmää. Koulut, erityisesti peruskoulut, muistuttavat autotehtaita: otamme lapset “valmistusvuoden” mukaan ja sitten, kuten tehdaslinjalla, keräämme heidät luokkiin täysin ilman yksilöllistämistä. Tulevaisuuden koulutus tulee olemaan paljon yksilöllisempää, koska nämä koulutietopaketit kerätään erittäin hyvin tekoälyjärjestelmien avulla, ja ne mahdollistavat tietojen tallentamisen ja tarjoamisen niin, että jokaisella koululaisella on oma oppimispolkunsa. Tällä hetkellä se kuulostaa utopistiselta, mutta ChatGPT on jo läpäissyt tohtorin ja opettajan kokeen, ja jos puhumme 50 vuoden perspektiivissä: oppilaat opiskelevat kieliä yksilöllisesti kommunikoittaen täysimääräisesti sekä tietokoneen että opettajan kanssa. Ja tietokone tarjoaa erilaisia oppimismuotoja, jotka sopivat kuhunkin oppilaaseen.


Toinen näiden teknologioiden käytön vaikutus liittyy demokratisoitumiseen. Laadukkaisiin teksteihin saavat pääsyn jopa ne, jotka eivät puhu kovin hyvin kyseistä kieltä. Esimerkiksi maahanmuuttajat, jotka joskus eivät osaa kirjoittaa ilmoitus poliisille, ja tämä toimii korruptoitumisen lähteenä eri maissa. Uudet järjestelmät laajentavat kielitaidon kapeaa pullonkaulaa. Ihminen, joka ei välttämättä hallitse kirjoitettua muotoa hyvin, kirjoittaa upeita hakemuksia, esseitä, ohjelmointikoodia... Tämä on esimerkki siitä, miten teknologiat todella helpottavat pääsyä kieleen ja tekevät kielen hallitsemisesta vähemmän elitististä.


Tästä seuraa vielä yksi asia: ero kirjallisen ja suullisen muodon välillä kasvaa. Sama henkilö tuottaa suullisia ja kirjallisia tekstejä eri laadulla. Venäjän kielessä tällä hetkellä ero näiden muotojen välillä ei ole kovin suuri, meillä on ero ääntämisessä, mutta periaatteessa eroa ei ole kieliopissa. Mutta suomen kielessä suullinen ja kirjallinen muoto eroavat voimakkaasti, suullisessa kielessä on erilaisia kieliopillisia muotoja. Se, mitä näemme suomen kielessä, saattaa mahdollisesti levitä myös muihin kieliin.


Viimeiseksi ihmiset jakautuvat niihin, jotka vain käyttävät työkaluja ja luovat keskinkertaisia tekstejä, ja niihin, jotka osaavat käyttää näitä teknologioita niin korkealla tasolla, että tekstistä tulee vieläkin yksilöllisempää. Bourdieun perinteen mukaisesti tulee syntymään eliittiä kielenkäytön muodoissa, jotka säilyttävät tai ehkä jopa elvyttävät erityyppisiä kirjoitusmuotoja. On mahdollista, että 50 vuoden kuluttua me ylpeilemme siitä, että kirjoitamme kursiivia. Tällaiset eliittimuodot, jotka ovat raskasta sekä kirjallista että suullista kielenkäyttöä, pysyvät varmasti olemassa. Niitä kuvaa loistavasti Vladimir Sorokin romaanissa "Manaraga", jossa esteetikot metsästävät käsikirjoituksia valmistaakseen niistä grilliruokaa. Mutta valitettavasti käsikirjoitukset eivät palaa...


Totta kai syntyy myös ongelmia: tekstejä tulee syntymään niin helposti, että niitä tulee olemaan niin paljon, ettemme kykene käsittelemään niitä kaikkia. Tämä johtaa siihen, että tulee olemaan  ihmisiä, jotka vain käyttävät valmiita työkaluja kuten ChatGPT, ja sitten  taitavia ammattilaisia, jotka osaavat analysoida tekstiaineistoja. Tämä tekstien aalto, tai jopa tsunami, johtaa siihen, että tietojen analysointi tulee olemaan minimivaatimus kielellisten töiden tekemiseen yleisesti. Uskon, että ammatit kuten kääntäjä tai opettaja jakautuvat kahteen suureen ryhmään: niihin, jotka osaavat käyttää näitä työkaluja, ja niihin, jotka jäävät työttöminä.


- Mutta täytyykö meidän pelätä, että tämä teknologia joskus tulee älykkäämmäksi kuin ihminen?


Sanon varovasti, että en tiedä, mutta esitän muutaman argumentin, miksi ei silti kannata pelätä. Ensimmäinen argumentti on ontologinen: lapset omaksuvat kielen ja ylipäätään maailman periaatteellisesti eri tavalla kuin järjestelmät oppivat. Kun synnymme, katsomme ympärillemme: tuolla on äiti ja isä, he sanovat "mene syömään, puuro jäähtyy...". Ja ymmärrämme, että meille annettiin puuroa yhdessä kulhossa, vaan seuraavana päivänä – toisessa kulhossa. Lopulta, yleistämme tosiasiat todellisesta maailmasta, eli katsomme, kuulemme, havaitsemme, mitä tapahtuu ympärillämme, ja tietomme, jotka on vakiinnutettu kieleen ja ei vain kieleen. Tämä on ympäröivän todellisuuden yleistäminen. Tekoälyjärjestelmä koulutetaan teksteillä, ja tässä on perustavanlaatuinen ero. Kaikki, mitä on kirjoitettu teksteissä, kone yleistää, mutta jos jotain ei ole teksteissä, sitä ei ole mallissa. Maailma on tietysti paljon monimutkaisempi kuin mikään tekstimassan kokoelma, joten olemme paljon enemmän sidoksissa maailmaan ja tiedämme paljon enemmän maailmasta kuin mikään tekoäly. Meidät pelastaa ihmisen eksistentiaalinen luonne.


Toinen argumentti liittyy siihen, että meillä, elävillä olennoilla on asenne, joka voi olla moraaliton, periaatteellinen, itse asiassa hyvin epävarma — jollain tavalla me kykenemme ottamaan kantaa asioihin. Algoritmit, joista puhun, ovat luonteeltaan opportunistisia. Jos todennäköisyydet asettuvat tietyllä tavalla, tulee tietty vastaus, jos toisin, tulee toinen vastaus — välittämättä moraalisesta imperatiivista. Kun toistamme ChatGPT:lle saman kysymyksen, se antaa erilaisia vastauksia, joskus ei vain sanavalikoiman mielessä, vaan myös sisällön, koska sillä ei ole omaa asemaa. Schopenhauerin termein näillä järjestelmillä saattaa olla Vorstellung, mutta varmasti ei ole Willeä. Tekoäly itsessään ei kykene nousemaan metallikylpyammeesta ja lähtemään valloittamaan näitä nahkakalloisia lurjuksia.


"Kuinka neuroverkot muuttavat kieltä?"

4. maaliskuuta 2024

"Rozental ja Guildenstern" Puhe- ja kieliopiston studio

Lisäykset: Mikhail Kopojev

Версия подкаста на русском:


Kommentit


Бетонная стена

Kopeekka

Slaavilaisten ja balttilaisten kielten opiskelijalehti

Копейка

bottom of page