Mitä tekoäly on? Tekoälyllä tarkoitetaan tyypillisesti tietokoneen tai ohjelmiston kykyä käyttää perinteisesti ihmisen älyyn liitettyjä taitoja, kuten päättelyä, oppimista, suunnittelemista tai luomista (Euroopan parlamentti, 2020). Yksinkertaistetusti tekoäly vaatii kolmea asiaa: (1) käsiteltävää dataa eli tietoa, (2) algoritmeja eli tietokoneen toimintaohjeita ja (3) riittävää tietokoneen laskentatehoakykyä käsitellä tietoa algoritmien avulla.
Tekoäly voidaan määritellä järjestelmän kyvyksi tulkita ulkoista dataa oikein, oppia kyseisestä datasta ja käyttää näitä oppeja tiettyjen tavoitteiden ja tehtävien saavuttamiseksi joustavan sopeutumisen kautta (Haenlein & Kaplan, 2019). Tekoälyn muodot voivat olla ohjelmistoja, kuten virtuaaliset avustajat, kuvia analysoivat ohjelmistot, hakukoneet tai puheen- ja kasvojentunnistusjärjestelmät, tai fyysiseen rakenteeseen upotettuja tekoälyjä, kuten robotit, itseohjautuvat autot, droonit tai asioiden internet.
Arjessa käytämme usein huomaamattamme monia digitaalisiin palveluihin ja järjestelmiin integroituja tuki-älyjä, kuten hakukoneet, verkkokauppasuositukset, somepalvelut syötteet (fiidit, eng. feed) ja striimaus-palvelujen suositukset sekä puheentunnistusohjelmistot (Siri, Alexa). Opetustyössä digitaalisiin oppimis-ympäristöihin on upotettu monia tekoälyn avulla toimivia ominaisuuksia, kuten reaaliaikainen puheen kääntäminen käyttäjän kielelle käyttäjän laitteeseen (PowerPoint Live Translation) tai Teams-ympäristön lukutaidon edistymisen työkalu (Reading Progress), joka antaa tekoälyn avulla oppilaalle automaattista palautetta lukemisesta ja lausumisesta.
Tässä oppaassa keskitytään generatiivisiin tekoälysovelluksiin, joten jatkossa termillä tekoäly viitataan artikkelissa ensisijaisesti generatiivisiin tekoälyihin. Generatiivisia tekoälyjä ovat
- tekstiä generoivat tekoälymallit, kuten ChatGPT, Bing ja Google Gemini (ent. Bard)
- kuvia generoivat tekoälymallit, kuten Midjourney, Dall-E ja Stable Diffusion
- videota generoivat tekoälymallit, kuten Sora ja HeyGen
- ääntä tai muuta generoivat tekoälymallit.
Generatiivisia tekoälyjä koulutetaan valtavalla määrällä dataa. Esimerkiksi Chat GPT-4 -tekoälyn kouluttamiseen käytetyn tekstidatan määrän on arvioitu olleen satoja teratavuja, mikä vastaa satojen miljoonien kirjojen tekstimäärää. Tämän koulutusdatan pohjalta generatiiviset tekoälyt sitten tekevät tilastollisin menetelmin ennusteita, mitä sanaa seuraavaksi tulisi käyttää vastausta muodostettaessa.
Tekoälyn käyttöä oppii parhaiten itse kokeilemalla tekoälypalveluja monipuolisella tavalla. Hyvien syötteiden eli promptien muotoilu on taito, joka kehittyy kokeilemalla. Ensimmäinen syöte ja siten myös ensimmäinen tekoälyn vastaus harvoin on heti toiveiden mukainen. Tyypillistä on, että tekoälylle annetaan useita edellisiä täsmentäviä, laajentavia tai syventäviä syötteitä, jolloin käyttäjä saa myös parempia vastauksia.
Tekoälypalvelut eivät osaa arvioida antamiensa vastausten oikeellisuutta, vaan ne pyrkivät vastaamaan käyttäjän kysymyksiin tai tekstitoiveisiin riippumatta siitä, onko vastaus oikein tai sisällöllisesti järkevä. Tekoälyn teksti voi siis olla täysin järjetön, vaikka vastauksen muotoilu näyttäisi järkevältä. Tekoäly voi hallusinoida eli tuottaa mihinkään faktaan pohjautumattomia vastauksia kuten lähdeviittauksia tutkimuksiin, joita ei ole olemassa, tai matemaattisia kaavoja, jotka eivät pidä paikkaansa.
Tekoälypalvelujen käytössä on oltava tarkka tietoturvasta ja tietosuoja-asioista. Älä syötä henkilökohtaisia tietoja, pankkitietoja, oppilastietoja tai muita tunnistettavia kuvauksia tekoälypalveluihin! Muista noudattaa oman koulun ja koulutuksenjärjestäjän ohjeita sähköisistä palveluista sekä oppilastiedoista ja tunnuksista.