Tässä vaiheessa kukaan ei ole välttynyt kuulemasta kyllästymiseen tai pakahtumiseen asti uusista tekoälyteknologioista. Tästä huolimatta useimmille ei välttämättä edelleenkään ole selvää, mitä ne oikeasti tekevät tai mitä niillä voi tehdä. Dokumentaation kenttä on monen näistä mahdollisuuksista ja kenties uhkista leikkauspisteessä, joten kysyin mielipiteitä aiheeseen tekoälyjen kanssa työskentelevältä kaveriltani. Lisäksi käyn läpi omia havaintojani ja ajatuksiani liittyen tekoälyjen suhteesta dokumentoijien työhön.
Haastattelu alan ammattilaisen kanssa
Tämä haastattelu käytiin sähköpostin välityksellä to 7.3.2024 ja 11.3.2024 välisenä aikana. Tunnen Oliverin yhteisten harrastuksien kautta ajalta, kun opiskelimme molemmat Readingin yliopistossa. Olen tietenkin kääntänyt hänen vastauksensa tämän kirjoituksen suomenkielisessä versiossa. Englanninkielinen versio sisältää hänen alkuperäiset vastauksensa.
Haastateltava: Oliver Back
Asiakaspalvelun ja yhteisönhallinnan esihenkilö, Scholarcy
Alkujaan opiskelin akateemisesti nestetipparobotiikkaa, ja nyt olen töissä opetusteknologian parissa. Päämääränäni on tehdä akateemisista tekstistä saavutettavampia kaikille.
Haastattelija: Sami Rissanen
Dokumentaatioasiantuntija, DoX Systems
Kuulemma opiskeli aikoinaan filosofiaa. Todistajia tämän varmentamiseksi ei ole löytynyt elävinä. Ä̸͙̟̈́ͅl̷̫͒͌ạ̴̈̃ ̵̝̦̳͛̑̓̃ỷ̴̧͖̫̭͕r̴̬̻̞̅͒͂͘ì̴̫̺t̶̼̙̹̜̀͌̂͐͠ä̸̢̨̨̗̟̅̒̎̈́ ̴̩̟̪͆̆̋͝͝ͅt̴͕͎̍̉͐̅̈́u̶̞̻̲̼̒͐͠ț̵̝̮͕́̃̃͠k̴̖͆i̴̡̘͋̀͗̈͘͜á̸̯͈̪̱̺̀̚ ̵̙̤̬̱͒͜t̶͕͈̭̗̻͗͑̈́͝ä̸͎̬͇̭̪̏ţ̵̫̹̘̪͋ä̸͍̝̻̘͌.̶͈̖̊̒͋͜ Muutoin pääasiassa vaaraton tyylitiedostojen pyörittäjä.
Sami, kysymys 1:
Voisitko lyhyesti esitellä itsesi ja kertoa, mitä teet generatiivisten tekoälyjen parissa?
Oliver, vastaus 1:
Nimeni on Oliver Back, ja työskentelen opetusteknologian alan yrityksessä nimeltä Scholarcy. Opiskelin alkujaan kybernetiikan tohtoriksi, ja tutkimukseni aihe oli Belousov–Zhabotinskyn reaktioon perustuva nestetipparobotiikka. Olen innokas salilla käyjä, ja tämänhetkinen pakkomielteeni on Warhammer 40 000.
Scholarcy muuntaa akateemiset artikkelit ja oppikirjat vuorovaikutuksellisiksi muistiapukorteiksi, joiden avulla opiskelijat sekä tutkijat voivat seuloa ja selata akateemisia kirjoituksia ja arvioida niitä kriittisesti. Scholarcy käyttää ei-generatiivisia suuria kielimalleja (LLM) kirjoittajien sisällyttämän tärkeimmän informaation, faktojen ja tuloksien artikkeleista poimimiseen. Nämä tekstin osuudet muotoillaan sitten uusiksi niiden saavutettavuuden lisäämiseksi kiireisille tai akateemiseen kirjoitustapaan tottumattomille lukijoille.
Scholarcy käyttää näitä ydinfaktoja ja tarkkaan määritettyjä kehotteita Yhteenveto-osion tuottamiseen. Tämä on ainoa muistikortti, joka perustuu generatiiviseen tekoälyyn, ja sen tarkoitus on antaa lukijalle yleiskatsaus artikkelia koskien. Tällä tavoin kukin lukija saa mahdollisuuden ennakoida käytettyjä avainkonsepteja, mikä auttaa lukijoita pääsemään liikkeelle pitkien tekstien tehokkaammassa lukemisessa.
Sami, kysymys 2:
Ymmärrän, miksi tuo on arvokasta. Suurin osa yleisöstämme työskentelee luultavasti nimenomaan teknisen dokumentaation parissa. Onko sinulla käyttökelpoisia kokemuksia dokumentoinnista tai sen tuloksista, joiden perusteella voimme keskustella generatiivisen tekoälyn käyttötapoja siinä yhteydessä?
Oliver, vastaus 2:
Mielestäni generatiivinen tekoäly on hieno työkalu teknisten kirjoittajien käyttöön. Mutta se ei ole muuta kuin työkalu. Tässä muodossaan se ei koskaan korvaisi ihmisen osuutta, sillä löytyy niin monia tapoja, joilla generatiivinen tekoäly voi tulkita asioita väärin tai olla huomioimatta loppukäyttäjän tarvitsemaa tiettyä nyanssieroa. Kokemuksestani Scholarcyllä en tapaa käyttää generatiivista tekoälyä minkäänlaiseen dokumentointiin tai tekemiini käyttöoppaisiin, sillä koen tuntevani kyseisen ohjelmiston paremmin kuin mikään tekoäly tällä hetkellä, ja veisi pidempään työstää kyseinen teksti uusiksi käyttäjiemme hyödynnettäväksi ilman tarvetta yhteydenotoille lisäkysymyksiä varten.
Generatiivisen tekoälyn käyttö on ollut vahvasti esillä Scholarcyllä, ja satuin haastattelemaan pilviohjelmistojen ohjelmoijaa koskien hänen ajatuksiaan generatiivisen tekoälyn käyttämisestä sekä ohjelmointiin että hänen työnsä dokumentointiin. Hän koki, että se voi helpottaa joitakin monien ohjelmoijien kohtaamia kipupisteitä, mutta että sillä on myös haittapuolensa. Kukaan ei tiedä, minne näihin malleihin syötetty data päätyy, ja kukaan ei halua olla se kehittäjä, joka syötti tuotannon koodia avoimeen järjestelmään. Tästä syntyy uusi ongelma, missä yhtiökohtaiset ongelmat uudelleenmuotoillaan ja naamioidaan, jotta näitä työkaluja voi käyttää. Ulosanti täytyy edelleen tarkistaa samaan tapaan kuin koodin kopiointi Stack Overflow’sta tai välttämättä toimi heti, ja kehittäjän täytyy ymmärtää, kuinka ohjelmointi toimii, näiden työkalujen hyödyntämiseksi.
Mielestäni kyllä generatiivinen tekoäly on ja tulee olemaan hieno työkalu teknisten kirjoittajien käyttöön osana heidän työnkiertoaan, sillä se voi tarjota kehyksen tai kehikon, jota he voivat käyttää lopputulemaan oikaisemiseksi, mikä on itsessään taito. Aivan kuten markkinointitekstien kirjoittaminen, oikolukeminen ja tekstien toimittaminen ovat kukin erityistaitoja, generatiivisen tekoälyn kirjoituksien tulkinta on moderni tapa toteuttaa tuttu kirjoitusprosessi.
Jos markkinointitekstien kirjoittaja tai tekninen kirjoittaja haluaa käyttää generatiivista tekoälyä, heidän tulisi tehdä niin! Se voi auttaa ohittamaan hitaat osuudet. Jokainen kirjoittaja ymmärtää, kuinka joskus he jumiutuvat tuijottamaan tyhjää sivua miettien, kuinka päästä alkuun. Tekoäly voi ratkaista auttaa tämän ongelman ratkaisemiseksi, ja se antaa ainakin jotakin työstettävää.
Olen iso FBR-kirjoittamismenetelmän fani. Fast, Bad ja wRong. Se on keino saada ajatukset sivulle ennen muokkauksia, rosoisesti muotoiltujen lauseiden täydentämistä sekä selityksien selkiyttämistä. Generatiista tekoälyä voi käyttää juuri tähän tapaan, paitsi että puolen tunnin käyttämisen kaikkien ideoidesi ylös kirjaamiseen niiden mieleen tulemisen järjestyksessä sijaan voit käyttää 30 sekuntia ohjeistukseen, lisätä jokusen kehotteen, ja pääset heti muokkaamaan ja tarkistamaan faktoja
Sami, kysymys 3:
Kieltämättä voin nähdä tuollaiset käyttötavat. Teknisen dokumentaation parissa työskentelee tosin myös sisältöarkkitehteja, teknisiä kuvittajia, katselmoivia insinöörejä ja kääntäjiä teknisten kirjoittajien lisäksi. Olisiko sinulla ehdotuksia, kuinka he voisivat hyödyntää generatiivista tekoälyä tehtäviensä tueksi?
Oliver, vastaus 3:
Generatiivista tekoälyä voi käyttää kirjoitusprosessin aloittamiseen. Kun projektin parissa työskentelee yhdessä monia ihmisiä, voi olla helppoa löytää lähtöpiste, koska käytettävissä on niin monia hyviä huomioita. Tämä informaatiovyöry voi kuitenkin olla haaste alkuun pääsemiselle. Kuinka tyhjästä sivusta päästään täydellisesti muotoiltuun tekniseen dokumenttiin?
Kirjoittajat voivat käyttää generatiivista tekoälyä alkuun pääsemiseen. Lyhyt dokumentin kuvaus ja muutama tarkkaan harkittu kehote voivat antaa käytettäväksi kehikon. Faktojen tarkistus on pakollista, samoin kuin lisätietojen antaminen ja selityksien selkiyttäminen. Mutta tämän käyttäminen pohjana voi lisätä tehokkuutta ja poistaa alalle pääsyn esteet monilta kirjoittajilta.
Toinen generatiivisen tekoälyn käyttökeino, joka voi auttaa tällaisia ryhmiä, ovat tapaamisten tallentamisen työkalut. Kirjalliset kopiot ja tiivistelmät tapaamisista ovat mahtava saavutettavuuden apu monille, ja ne antavat kaikille toisen mahdollisuuden huomioida jotakin tärkeää, mikäli he olivat sattumalta harhautuneita, tai heidän ollessaan väsyneitä tai sairaita.
Sami, kysymys 4:
Tuossa on selvästi potentiaalia. Mitä mieltä olet tosin sisäpiiriläisenä, mitkä ovat generatiivisen tekoälyn teknologian suurimmat joko lähtökohtaiset tai tämänhetkiset rajoitteet, ja kuinka ne ilmenevät?
Oliver, vastaus 4:
Kuinka kiinnostava kysymys! Generatiivisen tekoälyn mahdollisuus hallusinoida aiheuttaa paljon huolta, että epätotuuksia pääsee mukaan sen kirjoituksiin. Tätä vastaan voi taistella kaiken sisällön läpi käyvän oikolukijan avustuksella, mutta tämän ehtona on heidän aihealueen tuntemuksensa riittävyys virheiden tai tekoälyn tuomien vääristymien tunnistamiseksi. Tällaiset viat on helpompaa havaita, kun kyse on pienemmästä kirjoituksen määrästä. Mutta kun vaaditaan paljon pidempää dokumentaatiota, aikakustannukset ja koko dokumentin tarkistamiseen vaadittu energia voivat toimia esteenä, mikä päästäisi pienemmät virheet seulan läpi.
Sami, kysymys 5:
Ja tämän mielessä pitäen, käynnissä on keskustelua siitä, onko generatiivisen tekoälyn teknologia pitkälti pitkän ajan hyödyiltään rajallinen villitys vai aito teknologinen vallankumous. Millä generatiivisen tekoälyn käyttötavoilla arvioisit olevan kaiken kaikkiaan suurin potentiaali pitkäaikaisille hyödyille?
Oliver, vastaus 5:
En todellakaan usko, että tekoäly on villitys tai että se on menossa minnekään. Mielestäni löytyy monenlaisia käyttötapoja, joiden osalta tekoälyn saapuminen on vallankumouksellista. Isoon dataan perustuvat ratkaisut tulevat näkemään lisäinnovaatioita, ja käytetyt algoritmit käyvät isommiksi, paremmiksi ja nopeammiksi. Toivon tämän tarkoittavan, että terveydenhuolto ja lääketieteellinen tutkimus hyötyvät valtavasti, mutta voin nähdä myös markkinoinnin ja kohdennettujen mainoksien tehostuvan!
Haluan nähdä koulutuksen saralla työkaluja, jotka käyttävät tekoälyä hyvän tekemiseen. Tarjolla on jo tällaisia työkaluja, joihin Scholarcy lukeutuu, ja on mielenkiintoista nähdä, kuinka tällainen teknologia kehittyy ja paranee ajan kanssa. Useimmat opiskelijat lakkaavat kehittämästä opiskelutaitojaan toisen asteen koulutuksen loppuessa, joten on on innostavaa nähdä työkalujen kuten Luna rakentavan valmiiden opiskelutaitojen päälle käyttäen tekoälyä käyttäjiensä oikein suuntaamiseen sisällön uudelleen läpikäynnin osalta.
Tekoälyn käyttöä ajetaan voimakkaasti osakekaupan algoritmeissa, eikä siinä ole mitään uutta. Kun minulle opetettiin yliopistolla rekursiivisen pienimmän neliön algoritmista, luennoitsija mainitsi, kuinka sen avulla ei voi ennakoida osakkeiden hintoja, koska osakekauppa on aikasidonnainen muttei aikaa muuttujana siirtofunktiossaan käyttävä järjestelmä. Tietoon aiemmista ihmisten toimintatavoista, pörssikursseista, uutisvirrasta tai jopa ihmisten tarpeista perustuva algoritmi kuulostaa valtavalta etulyöntiasemalta. Tämä ei kuitenkaan välttämättä toimi ihmisluonnon tai edes ihmisten tarpeiden ennakointiin. Suuret kielimallit toimivat, koska kielenkäyttö on jokseenkin ennakoitavaa. Uusia sanoja ja kielioppeja voi toki keksiä, mutta kyseessä ei ole nopea prosessi, ja uusi slangi yleensä noudattaa ennakoitavia sääntöjä, jotka tekoäly voi ottaa käyttöön ja oppia. Sen sijaan ihmisluontoa ei välttämättä saa koulutettua koneelle samaan tapaan, joten en itse ole täysin vakuuttunut tekoälyn kyvystä ’ratkaista’ osakepörssiä.
Mielestäni suurin generatiivisen tekoälyn sovelluspaikka on digitaalisen sisällön luominen. Kirjoittaminen, toimittaminen ja oikolukeminen ovat joitakin ’idioottivarmimmista’ saatavilla olevista tekoälyteknologioista, ja tilanne siltä osin sen kuin paranee. Pidän kuitenkin todennäköisenä, että käyttötapa muuttuu täysin. Jossakin vaiheessa tekniset oppaat eivät enää ole tarpeen, kun kirjaudut verkkosivulle ja käytät yhtiön chattibottia ongelman ostamasi tuotteen kanssa tunnistamiseen sen sijaan, että lukisit sen kanssa toimitetun lehtisen tai edes selaisit läpi verkon löytääksesi jonkun, joka on ratkaissut kohtaamasi ongelman. Useimmat uudet puhelimet ja tietokoneet ovat siirtymässä eroon aiemmasta valmisteluprosessista, jonka jouduit käymään läpi. Useimmat uudet laitteet toimivat käytännössä heti käynnistämisen jälkeen. Toki niihin kuuluu käyttöönottomenettely, mutta se koostuu lähinnä sähköpostiosoitteeseesi kirjautumisesta, wifi-verkkoon kytkemisestä ja lopun jättämisestä laitteen tehtäväksi.
Sami, kysymys 6:
Kiitos paljon. Onko sinulla lopuksi sanottavaa asioista, jotka jäivät käsittelemättä muiden kysymyksien ohessa?
Oliver, vastaus 6:
Mielestäni tekoälyjen tila on kiinnostava, ja tälle teknologialle löytyy niin monia mahtavia käyttötapoja, jotka voivat mahdollistaa niin monia mahtavia asioita. Mutta muotisanan ympärillä on myös hehkutusta, että kaiken tulisi olla tekoälypohjaista. Kaverini mainitsi hiljattain jopa tekoälypohjaisen leivänpaahtimen!
Olisi hienoa, että useimmat voisivat käyttää tekoälyä osana työtään tai harrastuksiaan tai ylipäätään elämänsä helpottamiseksi.
Arvostan kysymiäsi kysymyksiä, Sami, ja kiitos ajatuksieni kuulemisesta!
Haastattelun yhteenveto
Oliverin kannan generatiivisen tekoälyn puolesta ytimessä on esteettömyys. Tällaiset työkalut voivat auttaa poistamaan erityistarpeisiin liittyviä esteitä tekemiselle. Esimerkkejä tästä ovat tiivistelmät sekä muutokset formaattien kuten puheen ja tekstin välillä. Lisäksi ne toimivat apukeinona aiheiden käsittelyn pohjien tekemiseksi, koska usein on helpompaa jatkotyöstää esiasteelle saatettua sisältöä kuin muodostaa uutta sisältöä tyhjästä.
Selvimmät rajoitteet hänen mukaansa koskevat tekoälyjen tuotoksien epäluotettavuutta. Tästä syystä on aina välttämätöntä, että näitä tuotoksia ei käytetä sellaisinaan, vaan ne tulevat asiantuntevien henkilöiden läpikäymiksi ja muokkaamiksi. Tästä syystä tekoälyllä tuotetut osuudet olisi syytä pitää lyhyinä ennen niiden läpikäyntiä.
On myös syytä huomioida, kuinka myös muut tekoälyn muodot kuin generatiivinen tekoäly pysyvät hyödyllisinä sen rinnalla ja paikoittain joko sen tukemina tai sitä tukevina. Hän kuitenkin arvioi, että tämän teknologian käyttö tulee laajenemaan ajan kanssa ja korvaamaan vanhoja toimintamalleja.
Omia ajatuksiani tekoälystä
Yleisesti ottaen olen taipuvainen skeptisyyteen generatiivisen tekoälyn osalta. Osittain tästä syystä halusin mukaan myös toisen näkökulman. Alla käyn läpi omat ajatukseni koskien sekä tekoälyn hedelmällisimpiä käyttöpaikkoja osana dokumentointia että sen lähtökohtaisia rajoitteita ja muita siihen liittyviä ongelmia. Tässä yhteydessä viittaukset tekoälyihin tarkoittavat generatiivisia tekoälyjä, ellen tarkenna toisin.
Generatiivisten tekoälyjen toimintamalli
Mielestäni liian suuri osa generatiivisia tekoälyjä koskevista keskusteluista ei ensin paneudu siihen, kuinka ne oikeasti toimivat. En missään nimessä ole asiantuntija tältä osin, mutta annan ohessa tiivistelmän tämänhetkisestä ymmärryksestäni kontekstiksi tälle keskustelulle. Tämä tiivistelmä on erityisen tärkeä väitteideni tämän teknologian rajoitteita osalta.
Perustan tämän tulkintani varsinkin seuraaviin lähteisiin:
- https://www.techtarget.com/searchenterpriseai/definition/generative-AI
- https://machinelearningmastery.com/what-are-generative-adversarial-networks-gans/
- https://towardsdatascience.com/understanding-generative-adversarial-networks-gans-cd6e4651a29
- https://towardsdatascience.com/understanding-variational-autoencoders-vaes-f70510919f73
Neuroverkot
Perimmiltään generatiivinen tekoäly perustuu edelleen neuroverkoille. Neuroverkko on algoritmi, joka koostuu
- arvollisista noodeista,
- noodien välisistä assossiatiivista suhteista,
- noodien arvot mahdollisiin syötteisiin sekä ulosanteihin yhdistävistä taulukoista, ja
- palautekanavista.
Noodit ovat itsenäisiä datapisteitä, jotka kykenevät muodostamaan suhdeverkkoja muihin noodeihin. Kullakin noodilla on sen muista eriyttävä ja vain sitä kyseisessä verkossa vastaava tunnistearvo.
Assosiatiiviset suhteet noodien välillä ovat keskinäisiä painotuksia, jotka kuvaavat esimerkiksi todennäisyyksiä, että yhden aktivoituminen johtaa toisen aktivoitumiseen, tai painoarvojen liikkumisen jakautumia niiden välillä. Tällä tavoin syntyy reittejä niiden mukaisiin ulosanteihin johtaville aktivoitumiskuvioille, kun neuroverkolle annetaan erilaisia lähtösyötteitä.
Noodien tai ryhmien noodeja tiloille voidaan puolestaan antaa taulukoinnilla merkityksiä, jotka vastaavat jotakin tosimaailman syötettä tai ulosantia. Tällaisia olisivat esimerkiksi ’käyttäjä kirjoitti ”koira”’ tai ’anna virheilmoitus’. Tällaisen tulkintamekanismin ei tarvitse kirjaimellisesti olla taulukko, mutta noodien arvot itsessään eivät ole merkityksellisiä kuin tällaisen rakennetun tai rakentuneen suhteen tosimaailmaan välityksellä. Tällä tavoin määrittyy, mitkä lähtösyötteet aktivoivat mitäkin noodeja, ja mikä sen ulkopuolinen syöte syntyy kunkin neuroverkon tarkistuksen aikaisen tilan perusteella.
Palautekanavat puolestaan sallivat näiden neuroverkkojen säätää noodien välisiä assosiatiivisia suhteita painottamalla niitä uudelleen. Tämä vaatii jonkinlaista joko positiivista tai negatiivista arvotusta, joka niiden ulosannille annetaan järjestelmän taipumuksien vahvistamiseksi tai heikentämiseksi, kunnes joiltakin osin alkaa muodostua tältä osin ihanteellisia tasapainotiloja suhteessa saatavilla olleisiin lähtösyötteisiin.
Näiden osien ja niistä muodostuvien järjestelmän toimintatapojen seurauksena neuroverkko kykenee iteratiiviseen ja suoraan valvomattomaan itsensä uudelleenmuokkaamiseen kohti palautekanavien avulla määritettyjä tavoitetuloksia.
Kilpailevat verkostot
Yksi palautejärjestelmän toteutustavoista, joita generatiiviset tekoälyt hyödyntävät, ovat generatiiviset kilpailevat verkostot (generative adversial network, GAN). Ne eivät ole ainoa tällainen vaihtoehto ja mahdollisesti eri menetelmiä on mahdollista myös yhdistellä erinäisin tavoin. Toinen vaihtoehto tältä osin olisivat esimerkiksi vaihtelulliset automaattiset koodaimet (variational autoencoder, VAE). Niiden toimintamalli perustuu eri formaattien välisien siirtymien keskeisen kompression ja kompressoidun sisällön uudelleenkasaamisen luomaan tulkinnalliseen vaihteluväliin ja viallisten tuotoksien karsimiseen käyttökelpoisten joukosta. Kilpailevat verkostot ovat tosin helpommin minun kuvattavissani toimintamallin tältä osin havainnollistamiseksi.
Tällaiset generatiivisia järjestelmiä mahdollistavat palautemenetelmät sallivat suhteessa vapaamuotoisia läpäisyehdot täyttäviä ulosanteja. Toisin sanoen ihanteellinen tasapaino ei rajaudu tiukalle kaistalle, vaan se koostuu annettujen määreiden kanssa yhteensopivasta laajemmasta kentästä mahdollisia ulosanteja. Koska ulosannit ovat vaihtelevia mutta edelleen tiukasti seulottuja verrattuna täysin satunnaisiin vaihtoehtoihin, ovat ne generatiivisia. Toisin sanoen ne ovat alkuperäisiä siinä mielessä, että ne ovat kykeneviä esittämään halutun mukaisia asioita ilman suoraan tunnistettavissa olevia vastaavuuksia käytettyihin näytteisiin.
Generatiivisen kilpailevan verkoston tapauksessa tekoälyn toteutus koostuu kahdesta neuroverkosta. Toinen niistä on määritetty tunnistajaksi ja toinen huijaajaksi, eli niiden saama palaute palkitsee joko onnistunutta huijausyrityksien tunnistamista tai onnistumista tunnistajan huijaamisessa. Tunnistajalla ei ole pääsyä kuin sen koulutusjoukon mukaiseen näytteeseen, mutta sen täytyy yrittää arvata, onko sille syötetty tuotos osa samaa laajempaa joukkoa kuin kyseinen näyte. Kun sen onnistumistodennäköisyys huijaajan tuotoksien tunnistamisessa on 50%, voidaan huijaajan tuotoksia pitää riittävän hyvinä kyseisen tunnistajan pakottamiseksi arvaamaan. Tässä vaiheessa se ei siis enää erota huijauksia aidoista näytteistä. Paremmat tunnistajat siis johtavat myös parempiin niiden avulla koulutettuihin huijaajiin. Nämä huijaajat ovat tekoälytuotoksien varsinaisia tekijöitä.
Huomiokyky
Toinen merkittävä tämänhetkisten generatiivisten tekoälyjen mahdollistaja on niihin rakennettu huomiokyky (attention). Kyse on niiden kyvystä käyttää välitöntä syötettä laajempaa sitä edeltävää kokonaisuutta osana uuden syötteen käsittelyä. Tämän voi ymmärtää suurempana välimuistina ja kykynä käyttää sen sisältöä tehtävien kannalta merkityksellisillä tavoin. Käytännössä se myös laajentaa neuroverkkojen käytettävissä olevaa välitöntä kontekstia, johon suhteessa se voi käsitellä saamansa syötteet niiden monimerkityksisyyden rajaamiseksi.
Ymmärtääkseni tällä tavoin siis esimerkiksi tekstintuottajat kykenevät ’muistamaan’ pidempiä osuuksia jo kirjaamiaan asioita ja huomioimaan sana sanalta kyseisen laajemman kontekstin ja siihen liittyvät todennäköisyydet jatkon osalta. Samoin ne kykenevät huomioimaan omat aiemmat tuotoksensa, kun käyttäjä pyytää sellaista esimerkiksi tarkentamaan, mitä se tarkoitti.
Tämä laajemman kontekstin huomiointi vähentää tuotoksien sisäisiä kontekstisokeuteen liittyviä piirteitä, jotka ovat osaltaan saaneet aiemmat tuotokset vaikuttamaan erityisen teennäisiltä. Nämä tuotokset eivät tämän seurauksena esimerkiksi yleensä vaihda aihetta lennosta vain siksi, että jokin käyttöön valikoitunut osan ulosannista muodostava ilmaisu onkin yhteensopivampi eri asiayhteyteen kuuluvien näytteiden kanssa. Käyttöliittymältään keskustelumuotoiset tekoälyt eivät myöskään yhtä helposti jätä huomiotta jo ilmaisemiaan asioita ja esimerkiksi yritä toistaa niitä korjatessaan vastauksiaan.
Tällainen huomiokyky ei kuitenkaan veny ilmaisumuodon ulkopuolisen kontekstin huomioimiseksi. Tämä jako sisäisen ja ulkoisen kontekstin välillä on tärkeä, koska edes rajaton huomiokyky sisäisen kontekstin suhteen ei tuota minkäänlaista kykyä ulkoisen kontekstin huomioimiseen. Se vaatisi täysin erillistä teknologiaa.
Tekoälyjen hyödyntäminen dokumentaatiossa
Mielestäni ensisijainen generatiivisen tekoälyn hyödyntämisen tapa teknisessä dokumentaatiossa ei ole tekstin tuottaminen sitä käyttämällä. Jotta sen saisi koulutettua vastaamaan riittävissä määrin tietyn yrityksen oppaiden tyyliä, tulisi se kouluttaa käyttämällä riittävää määrää valmista sen mukaista dokumentaatiota.
Sen sijaan näkisin itse hyödyllisimpinä seuraavat käyttötavat:
- Täydentävä tekstinsyöttö,
- Pelkistävät suotimet,
- Formaattisiirtymät ja
- Hakubotit.
Tämä ei ole kattava lista. Tekoälyjä voi käyttää myös esimerkiksi käännöksien tukena tai tyylitiedostojen kirjoittamiseen. Näissä muissa käyttötavoissa korostuvat kuitenkin tekoälyn rajoitteet, jolloin tuloksien tarkistamiseen tarvitaan joka tapauksessa samalla erityisosaamisella varustettu henkilö kuin minkä tarvetta tekoälyn avulla pyrittiin välttämään. Lisäksi tällainen tarkistaminen näissä tapauksissa voi olla yhtä raskasta kuin itse kyseisen työn itse tekeminen ellei raskaampaa.
Täydentävä tekstinsyöttö
Yksi rakenteisen dokumentoinnin järjestelmiin sisään rakennetujen yksilähteistämisen keinojen heikkouksista on, kuinka ne eivät itsessään kykene vaikuttamaan muutoin vastaavien mutta epäidenttisten rakenteisten palikoiden sisäisten muotoilujen yhtenäisyyteen. Niiden avulla voidaan siis luoda keskenään kasattavissa olevia palikoita, mutta nämä palikat ovat sisäisesti sovittamattomissa muutoin kuin pienempien vastaavien palikoiden avulla. Kieli on puolestaan tätä joustavampaa eli muotoilultaan yksiselitteiset palikat eivät mukaudu luonnollisiin kieliopillisiin vaihteluihin kielien välillä yksittäisten lauseiden sisäisten sanavalintojen hallinnoinnin osalta.
Aiemman dokumentaation avulla koulutettu tekoäly voisi periaatteessa antaa suosituksia tällaisten kaavan mukaisten osuuksien täydentämiseen oikean kaavan mukaisesti muutaman sanan jälkeen. Se voisi myös periaatteessa käydä muokkaamassa nämä osuudet uuden ohjeistuksen perusteella tavalla, joka toimisi paremmin kuin toiminto korvata kaikki haetun ilmaisun mukaiset kohdat.
Ymmärtääkseni tällaisia palveluita on jo tosin saatavilla lisäosina. Esimerkiksi Grammarlyn selainlisäosa on yhteensopiva myös DoX CMS:n tekstieditoreiden kanssa. En ole toistaiseksi tutustunut, voiko niitä kouluttaa oman teknisen dokumentaation perusteella antamaan muun dokumentaation tyylin kanssa yhteensopivia ehdotuksia.
Pelkistävät suotimet
Tekstien lisäksi dokumentaatio sisältää usein myös kuvia tai jopa videoita. Parhaan tiedon välittymisen, tietoturvan ja osallisten yksityisyyden suojan nimissä tällaiset osuudet olisi syytä pelkistää näyttämään vain tilannekohtaisesti olennaiset osuudet. Muu informaatio tulisi tällöin sumentaa tai peittää, jotta se ei harhauta käyttäjiä tai esimerkiksi aiheuta tarpeettomia tietosuojariskejä esittämällä kuvatun taustaympäristön sellaisenaan.
Generatiiviset tekoälyt ovat kykeneviä muokkaamaan niihin syötettyjä kuvia ja videoita annettujen ohjeistuksien mukaisesti. Tällainen käsittely ihmisen tekemänä voi viedä merkittävästi aikaa, vaikka kyse olisi suhteellisen yksinkertaisista muutoksista kuten käyttöliittymän muiden osuuksien tai esimerkkikuvakaappauksien ympäristön sisäisten arvojen peittämisestä. Usein se jätetään tekemättä, koska kyse on lisähyödystä vaatimuksen ohjeistuksen käyttäjille saattamisen ehdon sijaan. Tekoäly voisi siis tuoda näin lisäarvoa mahdollistamalla tällaisen jatkokäsittelyn suhteessa pienellä ajallisella panostuksella.
Formaattisiirtymät
Tekoälyt ovat kykeneviä lukemaan tekstiä tai tekstittämään puhetta. Lisäksi niiden kyky tuottaa videoita kuvauksien perusteella vaikuttaa kehittyvän nopeasti. Tällä tavoin dokumentoija saa siis yhdessä muodossa tuotetut dokumentit kääntymään useampaan muotoon pienellä lisävaivalla.
Rakenteisten dokumenttien lukemisen osalta olisin hieman huolissani tekoälyn kyvystä huomioida myös rakenteiset osuudet kuten listat tai taulukot asianmukaisesti. Vähimmäisehtona tältä osin olisi, että kyseiset dokumentit olisi tällöin alkujaankin kirjoitettu niiden lukutavalle soveltuvaan muotoon. Vastaava haaste jo aiemmin on syntynyt myös ruudunlukijoiden kanssa, jos dokumenteissa esimerkiksi käytetään näkymättömiä taulukoita näkymän asetteluun.
Hakubotit
Toimiva haku on elintärkeää vähänkään laajemman dokumentaation käytettävyydelle. Se varmistaa, että käyttäjät löytävät tarvitsemansa tiedon mahdollisimman vähällä vaivalla.
Vaikka tekoälyt eivät ymmärrä esimerkiksi syy-seuraus-suhteita, ovat ne merkittävästi sallivampia toimivien hakupyyntöjen osalta kuin esimerkiksi tarkkarajaiset (avain)sanahaut. Tästä syystä käyttäjien ei välttämättä tarvitse tietää ennalta, millä hakusanoilla heidän tulisi etsiä oikean sisällön löytämiseksi. He voivat myös muotoilla pyyntönsä luontaisemmin kysymyksiksi näiden kysymyksien kääntämisen hakutermeiksi sijaan.
Lisäksi tekoälyt kykenevät muodostamaan vastauksia erillisien dokumentoitujen osuuksien perusteella. Joskus tilanteessa vaadittu tieto voi olla jakaantuneena useampaan dokumentin tai jopa useamman dokumentin osuuteen. Tekoäly pystyy hakemaan tilannekohtaisesti tarvitut tiedot kustakin sen sijaan, että käyttäjän tulisi paikantaa ne erikseen ja yksitellen sen perusteella, mitä hän saa pääteltyä tarvitsevansa jo löydettyjen tietojen täydentämiseen.
Lisätietoja teknisen dokumentaation luettavuuden tekoälyjen näkökulmasta parantamiseksi löytyy täältä.
Tekoälyjen rajoitteet
Tekoälyteknologian toimittajien lupaukset ovat vain yksi puoli tätä kolikkoa. Koska kyse on useimpien peruskäyttäjien näkökulmasta lähes taikuudesta ja koska tämä teknologia kykenee kehittymään nopeasti koulutukseen käytettävissä olevan sisällön laajuuden sekä esimerkiksi kilpailevien verkostojen mahdollistaman itseopettamisen seurauksena, ovat monet sen kannattajat valmiita maalailemaan ilmaan villejä tulevaisuudenkuvia. Tämän teknologian kyky lunastaa kyseiset lupaukset ei kuitenkaan ole sen kehittymisen nopeudesta huolimatta itsestäänselvyys, koska kehityksen mahdollistava pohjateknologia pysyy samana ja sillä on sille ominaiset rajansa.
Olennaisimmat näistä rajoitteista dokumentoinnin näkökulmasta ovat näiden tekoälyjen tekemän käsittelyn merkityksettömyys, irtautuneisuus ja riippuvuus. Kukin näistä syvistä rajoitteista ilmenee usein eri tavoin.
Merkityksettömyys
Mistä merkkien kuten sanojen merkitys koostuu on liian iso filosofinen kysymys tässä yhteydessä käsiteltäväksi, eikä siihen ole saatavilla valmista yksiselitteistä vastausta. Tekoälyn tekemä käsittely ei kuitenkaan täytä käytännössä minkään näkökulman vähimmäisehtoja sille, että nämä sisällöt olisivat merkityksellisiä sen näkökulmasta. Useimmat filosofiset koulukunnat eivät edes pitäisi tekoälyjä ylipäätään näkökulmallisina.
Tämä käsiteltyjen sisältöjen merkityksettömyys niiden käsittelijälle eli tekoälylle itselleen on kuitenkin valtava rajoite. Se on osasyyllinen tekoälyjen niin sanottuun hallusinointiin, mutta käsittelen tätä ongelmaa erikseen irtautuneisuuden yhteydessä. Nimenomaisesti merkityksettömyys kuitenkin ilmenee kahdella välittömästi tunnistettavissa olevalla tavalla, jotka osoittavat tekoälyjen toimintaperiaatteiden rajoitteet.
Tekoälyt eivät koskaan kysy tarkentavia kysymyksiä.
Tekoälyt eivät korjaa vastauksiaan, vaan vastaavat uudelleen eri tavalla.
Miksi tekoälyt eivät koskaan kysy tarkentavia kysymyksiä? Tämä olisi ilmeinen tapa vähentää virheellisiä vastauksia, kun annettuihin kehotteisiin liittyy jonkinlaista epävarmuutta tai epäselvyyttä. Tekoälyt eivät kuitenkaan käsittele niille annettujen kehotteisen sisältöjä vaan muotoja. Ne eivät yksinkertaisesti osaa havaita tarvetta selvennyksille. Jos sellaisen saa kysymään lisätietoja, on kyse siitä, että kyseisenlaiseen kehotteeseen olisi tilastollisesti uskottavaa vastata tällaisella kysymyksellä. Kyse ei tällöin ole kysymyksestä vaan kysymysmuotoisesta vastauksesta, koska tekoäly ei kysy saadakseen vastauksia. Se ei ole kiinnostunut vastauksista, koska se ei kykene tähän.
Periaatteessa yllä esiteltyjen teknologioiden päälle olisi mahdollista rakentaa erillinen kehotteita optimoiva järjestelmä, joka pyrkisi varmistamaan varsinaiselle käsittelyjärjestelmälle syötettyjen kehotteiden riittävyyden sen tarpeisiin. Tällainen järjestelmä ei kuitenkaan voi rakentua saman teknologian varaan, koska se tarvittaisiin nimenomaan siksi, että kyseiset järjestelmät käsittelevät niille annetut syötteet vain merkkijonoina. Koska nämä merkit eivät ole merkityksellisiä niille, eivät ne kykene tunnistamaan merkitykseen perustuvia outouksia tai vajavaisuuksia. Esimerkiksi absurdi kysymys kuten ’Mitä mieltä presidentti Abraham Lincoln oli Internetistä?’ ei poikkea tekoälyn näkökulmasta aidosta kysymyksestä, joten se pyrkii vastaamaan siihen parhaansa mukaan. Mahdollisesti se kykenisi vastaamaan, että Abraham Lincoln eli ennen Internetin keksimistä. Tätä voisivat tosin haitata esimerkiksi meemit. Yhdessä laajalevikkisessä meemissä Abraham Lincolnin vitsaillaan sanoneen, että kaikkiin Internetissä törmäämiisi väitteisiin ei kannata luottaa vain siksi, että ne esitetään lainauksina arvostetuilta henkilöiltä. Tekoäly ei tunnista näiden meemien asiayhteyttä, joka olettaa ennakkotietämyksenä, että Abraham Lincoln ei tiennyt, mikä Internet on.
Tämä puolestaan johtaa toiseen yllä mainitsemaani rajoitteeseen: tekoälyt eivät korjaa vastauksiaan. Niitä voi pyytää korjaamaan vastauksiaan ja tällöin ne pahoittelevat virheitään ja muodostavat uuden vastauksen, joka rajaa pois kutakuinkin alkuperäisen vastauksen mukaiset vaihtoehdot. Vaihtoehtoisesti ne voivat inttää olevansa oikeassa, koska tämä olisi yleinen ja siten uskottava reaktio kyseenalaisetuksi tulemiseen. Yhtä kaikki, kyse ei ole vastauksen korjaamisesta, koska pyrkimyksenä ei ole sen suurempi tarkkuus vaan hyväksyttävyys käyttäjälle. Eri mieltä oleva käyttäjä pystyisi kertomaan tekoälylle, että oikea vastaus on väärä ja saamaan sen ’korjaamaan’ vastaustaan. Kuvittele vastaavassa tilanteessa tekoälyn tilalle henkilö, joka ’korjaisi’ vastauksiaan vain vastaamalla eri tavalla mutta tarkistamatta lainkaan lähteitä aiheeseen liittyen tai yrittämättä muutoin uudelleensuunnata seuraavia vastauksiaan muutoin kuin suoraan annetun palautteen perusteella. Mikäli kyse ei olisi pelkästä välinpitämättömyydestä totuutta kohtaan kyseisessä tilanteessa, tällainen käytös vaikuttaisi selvästi patologiselta.
Osa kuvaamistani tekoälyjen käyttäytymismalleista on luultavasti saatu ’korjattua’ samaan tapaan kuin tunnetut outoudet niiden tuottamissa kuvissa. Ymmärtääkseni tällaiset korjaukset muodostuvat yhdistelmästä kovakoodattuja suotimia ja uudelleenkoulutuksesta näiltä osin tarkemmiksi säädettyjen tunnistajien parissa. Yhtä kaikki tällainen jatkokehitys ei muuta ongelmien juurisyitä, jotka säilyvät riskitekijänä näiltä osin. Kaikkein alkeellisin ja kaikkein kehittynein tekoäly näiltä osin poikkeavat vain kykynsä tyydyttää käyttäjänsä asteessa. Ne ovat kaikki edelleen professori Emily M. Benderin ja hänen kanssatutkijoidensa kuvaamia ’satunnaispapukaijoja’, jotka toistavat ihmisten käyttäytymistä sokeasti sen mukaan, mikä käytös antaa niille keksejä. Benderin väitteistä voi lukea lisää esimerkiksi täällä.
Irtautuneisuus
Tekoälyjen irtautuneisuus tarkoittaa niiden yllä mainitsemaani kyvyttömyyttä hyödyntää minkäänlaista sisällön ulkopuolista kontekstia. Ne eivät kykene suhteuttamaan käsittelemänsälaisia medioiden muotoja niiden ulkopuolisiin seikkoihin, vaan kyse on ainoastaan koulutusnäytteessä olevan tämänmuotoisen sisällön pyörittämisestä edestakaisin ja eri tavoin paloittelemisesta ja sitten likiarvojen siitä itse kasaamisesta.
Kun puhutaan tekoälyjen taipumuksesta hallusinoida, on kyse tästä kyvyttömyydestä käsitellä syötteiden ulkopuolista informaatiota. Meille ihmisinä erottelut totuuksien ja valheiden välillä ovat mahdollisia, koska kykenemme vertailemaan väitteitä niiden ulkopuolisiin seikkoihin. Toki myös henkilöiden kyky tehdä näin heikkenee, kun kyse on esimerkiksi eroista, joiden tunnistaminen vaatisi erityisosaamista tai jotka eivät muutoin ilmene henkilöiden suorassa kokemusmaailmassa. Tekoälyn tapauksessa kyse on kuitenkin ääriesimerkistä tältä osin. Niiden kannalta mikään käytetyn syötteen ulkopuolinen ei ole olemassa, ja ne eivät täten kykene yhdistämään syötteen palasia sitä vastaavaan todellisuuteen niiden viitteiden tunnistamiseksi.
Tältä osin kyse ei siis ole hallusinoinnista vaan kehnosta esiintymisestä. Mielessä täytyy pitää, että generatiiviset tekoälyt on koulutettu pyrkimään huijata tunnistajia, jotka vertaavat niiden tuotoksia omassa käytössään oleviin näytteisiin. Tekoälytunnistajat kiinnittävät huomiota tekoälyjen logiikan kannalta merkitseviin seikkoihin sisältöjen muotoilussa ihmisiä paremmin ja niiden avulla on mahdollista nopeuttaa merkittävästi koulutuskierroksien määrää. Myös ihmiset ovat kuitenkin tunnistajia, ja me kiinnitämme ainakin joskus huomiomme myös seikkoihin kuten vastaavuuteen tosiseikkojen kanssa. Eräällä tapaa tältä osin on siis kyse vastaavasta tilanteesta kuin mestarillinen näyttelijä tai soluttautuja, joka on opetellut roolinsa ainoastaan lukemalla itselleen vieraan kielen tekstejä. Hän ei ymmärrä, mitä sanoo, ja häneltä puuttuu täysin kaikki kulttuurillinen konteksti kyseisille ilmaisutavoille. Kun hän tekee virheitä, ei kyse ole hallusinoinnista. Hän yksinkertaisesti kompuroi ja hapuilee sokeasti yrittäen vaikuttaa uskottavalta. Kuten Matt Pearce toteaa tässä Adam Conoverin podcastin haastattelussa, tekoälyt ovat erinomainen esimerkki Platonin luolavertauksen luolan vangeista, jotka tulkitsevat todellisuutta ainoastaan luolan seinälle heijastuneiden varjojen kautta ja joiden näkökulmasta koko todellisuus koostuu vain näistä varjoista.
Irtautuneisuus merkitsee myös, että tekoälyt eivät kykene hyödyntämään luovuutensa apuna kuin niiden käytettävissä olevien syötteiden mukaisia vaikutteita. Ajoittain niiden tekemää näytteiden sisällön yhdistelyä puolustetaan väittämällä, että tämä ei poikkea olennaisesti ihmisluovuudesta. Myös tällainen luovuus pääasiassa yhdistää vaikutteita, joista iso osa koostuu muiden tuotoksista. Merkittävä ero on kuitenkin, kuinka ihmiset voivat yhdistää vaikutteita vapaasti eri lähteistä: halki eri medioiden ja satunnaisten kokemuksien. Lisäksi nämä vaikutteet voivat ilmetä myös muunnettuina ja sovitettuina muutoinkin kuin vain muotoilultaan. Esimerkiksi yllä mainitsemani Platonin luolavertaus voisi ihmisen tapauksessa toimia inspiraationa tarinalle, jossa ihmiskunta on vangittuna todellisuuteen nähden epäyhtenevään virtuaaliseen harhaan. Tämän tarinan sisäiset näkökulmat kohtelisivat näitä epäyhteneväisyyksiä normaalina todellisuutena, kunnes niiden yhteys harhan ulkopuoliseen maailmaan paljastuu heille. Tekoäly kykenisi kenties rakentamaan hahmotelmaan maininnan luolavertausta koskien sekä hyödyntämään jo tätä viittausta hyödyntäviä tuotoksia tämän yhteyden ilmentämiseen. Mihin se ei tosin kykenisi olisi tämän viitteen käyttämiseen uusin tavoin, koska se pyrkii lähtökohtaisesti tuottamaan jo valmiiksi tutuilta vaikuttavia ulosanteja. Tällainen luovuus, joka pyrkii lähtökohtaisesti tuottamaan uudelta tuntuvia tulkintoja, on normaalia ihmisille, mutta se sotii tekoälyn toimintamalleja vastaan.
Toki tässä vaiheessa joku voi muistaa tekoälyjen tuottamia kuvia, joiden kaltaisia he eivät ole koskaan nähneet. En tarkoita tällä niiden outoja epäonnistumisia vaan hyvinä pidettyjä tuotoksia, jotka soveltavat esimerkiksi fraktaalikuvioiksi työstettyjä tuttuja aiheita tai sulattavat yhteen aiheita, joita kukaan ei ole aiemmin yhdistänyt vastaavalla tavoin. Näiden tuotoksien ainutkertaisuus on kuitenkin selitettävissä. Tärkein tällainen selittävä tekijä on yksinkertaisesti tekoälyjen poikkeava toimintamalli uuden tuottamiseksi. Tämä toimintamallin vieraus käy sitä ilmeisemmäksi, mitä vähemmän ilmeinen kehotetta vastaava tuotos olisi. Tämä puolestaan johtaa toiseen selittävään tekijään: kehotteiden kirjoittajan luovuus. Niiden rajoitteet huomioiden sovellettuina tekoälyt ovat tehokkaita luovia työkaluja. Tämä myönnytys voi kuulostaa ristiriitaiselta suhteessa aiempiin väitteisiini tekoälyjen luovista rajoitteista, mutta tekoäly itse ei ole sen luovampi tässä tilanteessa. Se on algoritmi, eli sen ulosanti määräytyy sille annetun syötteen perusteella. Käytännössä luovat ajatukset tulisi osata kääntää sen tarpeisiin, ja tähän eivät riitä yleistason kuvaukset kuten ’Matrix mutta sen virtuaalinen maailma perustuu suoremmin Platonin luolavertaukseen’. Tämä ero on tärkeää huomioida varsinkin, kun joidenkin odotukset tältä osin ovat, että tekoälyt kykenevät korvaamaan luovan työn tekijät. Toki luovan työn tekijät myös lähtökohtaisesti tekevät muutakin kuin tuottavat sisältöä, mistä syystä tämä käsitys on muutenkin vääristynyt.
Riippuvuus
Riippuvuuden osalta kyse on tekoälyjen rajojen määrittymisestä niiden kouluttamiseen käytettyjen syötteiden perusteella. Tämä on toki yhtälailla totta kaikkien oppijoiden osalta. Tekoälyjen tapauksessa tosin niille syötetään usein valtavia määriä materiaalia riittävän suoritustason saavuttamiseksi. Esimerkiksi tämänhetkisen tekoälyteknologian kehittäminen oli riippuvaa verkosta kahmitusta sisällöstä koostuvista suurista kielimalleista sekä kuvapankeista. Jos tällainen suoriutumistaso on tosin riippuvaa näistä muiden jakamista sisällöistä, on se myös haavoittuvaista muutoksille näissä sisällöissä.
Ironinen haaste tältä osin on, kuinka näiden järjestelmien yleistyminen voi itsessään heikentää niiden toimivuutta pitkällä aikavälillä. Mitä suurempi osuus niille annetusta syötteestä on tekoälyjen avulla tuotettua, sitä enemmän tekoälyjen uudet tuotokset vastaavat niiden aiempia tuotoksia. Pitkällä aikavälillä on mahdollista, että tällainen sukurutsa tuottaa uusille tekoälyhallitsijoillemme Habsburgien leuan ja verenvuototaudin. Korjaus voi hyvinkin löytyä tällaisesta vertauksesta geneettiseen perimään ja keinoista hallinnoida syötteiden alkuperien monimuotoisuutta. Toisaalta kyseinen projekti on ollut alusta alkaen eumemeettinen, sillä opetusnäytteisiin on todistetusti valikoitu nimettyjen taitelijoiden tuotoksia sekä korkealaatuisten julkaisujen sisältöjä. On täysin mahdollista, että harrastelijoiden tuotoksien mukaan koulutussyötteisiin ottaminen ilmenisi yhtä haitallisen tuntuisina taipumuksina kuin tekoälyjen omien tuotoksien toisintaminen. Ajatuksena on myös kiehtovaa, että kenties tekoälyjen koulutukseen sallitut syötteet joudutaan suodattamaan tekoälyjen tuotokset tunnistavien ohjelmistojen avulla. Tällaiset tunnistajat ovat kuitenkin toimintamalliltaan vastaavia kuin samojen tekoälyjen kouluttamiseen käytetyt tunnistajat. Toisin sanoen nämä tekoälyt on alkujaankin koulutettu huijaamaan tällaisia tunnistajia, joten suodattavien tunnistajien täytyisi aina joko pysyä koulutukseen käytettyjen tunnistajien edellä tai soveltaa niistä poikkeavaa tunnistusmenetelmää.
Toinen ongelma liittyen tähän tarpeeseen käyttää mahdollisimman laaja-alaisia syötteitä on, kuinka se altistaa nämä tekoälyt sabotaasille. Koska tekoälyt usein käyttävät hyväkseen sisältöjä luvatta, ovat varsinkin kuvataitelijat turvautuneet erillisiin sisältöjen myrkytystyökaluihin lakiteknisten tekijänoikeuskysymyksien ollessa vielä käsiteltävinä. Nämä työkalut kuten Nightshade lisäävät sisältöihin ihmisille näkymättömiä mutta tekoälyjä harhauttavia piirteitä. Kirjoituksien tapauksessa kyseessä voisi olla esimerkiksi piilotettu osuus, joka ohjeistaa tekoälyjä suoraan siltä osin, kuinka niiden tulisi vastata tätä sisältöä koskeviin kysymyksiin. Nämä ongelmat eivät ilmene ainoastaan hallinnoiduilla sisällöillä kuten yrityksien omalla dokumentaatiolla koulutetuissa tekoälyissä. Ymmärtääkseni kuitenkin useimmat tällaiset ratkaisut käyttävät edelleen pohjana julkisilla sisällöillä koulutettuja tekoälyjä, koska tällä tavoin varmistetaan riittävä pohjataso. Täten myös ne voivat olla alttiita tällaiselle myrkytykselle, jos tekoälyjen kehittäjät jatkavat koulutussisältöjen luvatonta käyttöönottamista.
Tällainen nälkä syötteille tämän riippuvuuden ruokkimiseksi on tietenkin ongelma myös silloin, kun kyseinen työkalu ottaa talteen sille annetut kehotteet sekä muut koulutussyötteet. Tämä on valtava tietosuojariski. Kaikki dokumentaatio ei todellakaan ole julkiseksi tarkoitettua ja oikein kohdennetuilla kehotteilla on mahdollista saada näistä järjestelmistä ulos suoria viittauksia niiden koulutussisältöihin. Tämä on yksi avainperusteista New York Timesin tekijänoikeusrikesyytteelle OpenAI:ta ja Microsoftia vastaan, mistä löytyy lisätietoja täältä. Vastaavasti Samsung toimii esimerkkinä tekoälytyökalujen käytön tuottamasta tietovuodosta, koska heidän työntekijänsä ilmeisesti syöttivät lähdekoodia ChatGPT:hen, mistä löytyy lisätietoja täältä. Kun tällainen virhe on tapahtunut, sitä ei saa vedettyä takaisin.
Yhteenveto
Jopa tekoälyjen asiantuntijan mielestä ne ovat tällä hetkellä ensisijaisesti keino automatisoida yksittäisiä kirjoitusprosessin vaiheita kuten lähteiden paikantamisen, esivedoksien tuottamisen ja sisällön toimittamisen. Ihmiskirjoittajat pysyvät välttämättöminä tämän sisällön jatko- ja välikäsittelijöinä, koska tekoälyt ovat liian epäluotettavia varsinkin sisällön merkityksien osalta. Niiden avulla voidaan kuitenkin tukea kirjoittajia alkuun pääsemisessä tai niiltä osin kuin kyseiset kirjoittajat muutoin kaipaavat tällaista apua. Osittain kyse on muiden kuin väistämättä tällaiseen työhön kuuluvien esteiden poistamisesta osallisuuden mahdollisuuksien lisäämiseksi.
Näiden järjestelmien toimintaperiaate on, että niiden käyttämät neuroverkot on koulutettu puoli-itsenäisesti käyttämällä valtavia datamassoja, joita huijaajasta ja tunnistajasta koostuvat kilpailevat neuroverkot pyrkivät joko jäljittelemään tai tunnistamaan jäljitelmiksi. Tämä ei ole ainoa vastaavaan tulokseen johtava menetelmä, mutta kukin näistä vaihtoehdoista sallii näiden tekoälyjen näennäisen luovuuden saatavilla olevien näytteiden jättämiin aukkoihin sopivina likiarvoina näytteiden mukaisista sisällöistä ja niiden palasista. Lisäksi nykyiset tekoälyt ovat uskottavampia ihmisnäkökulmasta, koska niillä on pidempi huomiokyky, eli ne kykenevät huomioimaan jatkuvuuden suurempien kokonaisuuksien osalta. Tämä tarkoittaa niin suurempaa sisäistä yhdenmukaisuutta kuin peräkkäisten kehotteiden välistä jatkuvuutta.
Minun nähdäkseni parhaat tekoälyjen käyttötavat dokumentoinnin tukena ovat täydentävä tekstinsyöttö, pelkistävät suotimet, siirtymät formaattien välillä sekä hakubotit. Nämä ovat kaikki työn muotoja, joihin tekoälyt tarjoavat erityisen toimivia apuvälineitä ja joiden osalta tekoälyjen heikkoudet kuten kyvyttömyys erottaa tosiseikat jäävät taka-alalle. Täydentävä tekstinsyöttö, joka on koulutettu käyttämällä aiempia omia sisältöjänne, antaa toistaa rakenteen kappaleiden sisäisiä osuuksia yhteneväisesti. Pelkistävät suotimet antavat peittää kuvista ja videoista harhauttavat tai muutoin tarpeettomat osuudet, jotka voivat epähuomiossa aiheuttaa ongelmia yksityisyydensuojan tai tietoturvan näkökulmasta. Sekä nämä suotimet että siirtymät formaattien välillä ovat laatua parantavaa mutta ei välttämätöntä lisätyötä, joka olisi usein vaikea oikeuttaa dokumentoijien kokonaan tekemänä. Esimerkiksi saman sisällön ilmaiseminen sekä tekstinä että videona olisi usein lähes kaksinkertainen työmäärä ja vaatisi molempiin dokumentoinnin muotoihin soveltuvia erikoistaitoja. Hakubotit puolestaan antavat loppukäyttäjien hakea tietoa totuttua luonnollisemmilla tavoin, koska haut eivät rajoitu merkkijonojen vastaavuuksiin. Periaatteessa ne myös kykenevät yhdistämään tietoa muutoin irrallisista osuuksista tilannekohtaisiin tarpeisiin vastaamiseksi.
Tekoälyillä on myös rajoitteensa, ja osa niistä liittyy teknologian toimintatapaan eikä vain sen avulla toistaiseksi saavutettuihin tuloksiin. Tästä syystä näistä ongelmista ylitse pääseminen ei ole tehtävissä pelkällä saman teknologian jatkokehityksellä, vaan se vaatisi täysin uusia toteutuksia. Näitä haasteita ovat esimerkiksi sisällön merkityksettömyys tekoälyille, tekoälyjen irtautuneisuus todellisuudesta ja niiden riippuvuus tarjotuista syötteistä. Koska tekoälyt eivät kykene käsittelemään kuin sisältöjen muotoja niiden merkityksien ja viittauskohteiden sijaan, ne eivät ole kykeneviä suuntaamaan vastauksiaan muutoin kuin välittömän palautteen mukaisella jo yritettyjen lähestymistapojen karsimisella. Ne eivät kysele tarkentavia jatkokysymyksiä toimintansa ohjaamiseksi, koska ne yrittävät vain ja ainoastaan tuottaa uskottavia vastauksia kehotteisiin. Tämä liittyy osaltaan myös niiden irtautuneisuuteen todellisuudesta, joka estää sisältöjen itsensä ulkopuolisen kontekstin hyödyntämisen. Tekoälyt vastaavat välittämättä todellisuudesta, koska ne eivät kykene todentamaan mitään väitteitä. Ne ovat matkijoita, jotka esittävät roolejaan parhaansa mukaan pelkän niille vieraan kielen kuulemisen perusteella. Tästä syystä ne eivät myöskään kykene yhdistämään vaikutteita niille tuttujen sisältöjen ulkopuolelta uusilla sovitustavoilla, ellei niiden käyttäjä tee tätä niiden puolesta kehotteissaan. Vastaava riippuvuus niiden käytettävissä olevista, ihmisten tuottamista näytteistä ilmenee myös muilla tavoin. Tästä syystä tekoälyjen omien tuotoksien yleistyminen voi itse asiassa johtaa niiden sisäsiittoisuuteen ja tuotoksien heikkenemiseen sen seurauksena. Lisäksi pyrkimykset käyttää mahdollisimman isoja datamääriä niiden kouluttamiseen lisäävät riskiä syöttää sekaan tekoälyjen kannalta myrkytettyjä sisältöjä. Tämä myös tarkoittaa, että ne janoavat syötteitä käyttäjiltään, mikä voi johtaa tietoturvariskeihin.