Suomalaistutkija toppuuttelee tekoälyhuumaa: ”Eniten yllättää se, miten vähän on tapahtunut teknologiassa”

Tekoäly-yhtiö Open AI julkisti äskettäin uuden kielimallin, joka on koulutettu ratkaisemaan ongelmia ”päättelemällä”. Yhtiön mukaan o1 nostaa tekoälyn uudelle tasolle.

OpenAI:n toimitusjohtaja Sam Altman. — Open AI:n toimitusjohtaja Sam Altman uskoo tekoälyn johdattavan ihmiskunnan ennennäkemättömään vaurauteen. Kuva: gian Ehrenzeller / EPA

Teemu Hallamaa

25.9.2024 11:07

Tekoäly-yhtiö Open AI:n toimitusjohtaja Sam Altmanilla on ollut kiireinen syksy.

Pari viikkoa sitten Open AI julkisti kielimallin, joka yhtiön mukaan kykenee tekemään päätelmiä. Yhtiö kuvailee erilaisilla ajatusketjuilla koulutettua malliaan askeleena kohti ihmisälykkyyteen yltävää tekoälyä.

Samaan aikaan Altman on kerännyt yhtiölleen miljardien dollarien rahoitusta. Talousjulkaisu Bloombergin tietojen mukaan tavoitteena on saada kasaan 6,5 miljardia dollaria, ja samalla määrittää Open AI:n arvoksi 150 miljardia dollaria.

Lisäksi Altmanin on uutisoitu tekevän yhteistyötä Applen entisen pääsuunnittelijan Jony Iven kanssa jonkinlaisen tekoälyä hyödyntävän laitteen parissa. Tämäkin yritys on keräämässä miljardin dollarin rahoitusta.

Toissa päivänä Altman julkaisi nettisivuillaan kirjoituksen, jossa hän pitää mahdollisena, että ihmiskunta onnistuu kehittämään super-tekoälyn muutaman tuhannen päivän sisällä eli alle kymmenessä vuodessa.

– Se saattaa viedä pidempään, mutta olen varma, että onnistumme siinä, Altman kirjoittaa.

Altmanin mukaan ihmiskunta on löytänyt algoritmin, joka kykenee todella oppimaan tiedosta. Tarvitaan vain laskentatehoa ja dataa, ja kaikki vaikeat ongelmat ratkeavat.

NVIDIAn toimitusjohtaja Jensen Huang. — Siruvalmistaja Nvidian on uutisoitu osallistuvan Open AI:n tulevaan rahoituskierrokseen. Nvidian grafiikkapiirit ovat avainasemassa tekoälyn kehityksessä. Keväällä Nvidian toimitusjohtaja Jensen Huang toimitti henkilökohtaisesti yhtiön uusimman grafiikkapiirin Open AI:lle. Kuva: Ritchie B. Tongo / EPA

Uusi malli ratkaisee ihmiseltä päättelyä vaativia tehtäviä

Chat GPT:n myötä koko maailman tietoisuuteen noussut Open AI on osoittanut, että tekoälyjärjestelmät ottavat Altmanin lupaamia kehitysaskeleita.

Yhtiö julkisti tässä kuussa uuden kielimallin, joka pystyy vastaamaan monimutkaisempiin kysymyksiin kuin muut kielimallit. Yhtiön sivuilla o1:ksi nimetty malli ratkaisee muun muassa haastavan loogista päättelyä vaativan arvoituksen:

Prinsessa on yhtä vanha kuin prinssi tulee olemaan, kun prinsessa on kaksi kertaa niin vanha kuin prinssi oli silloin, kun prinsessan ikä oli puolet heidän nykyisen iän summasta. Mikä on prinssin ja prinsessan ikä?

Ihmiselle voi olla vaikeaa hahmottaa pelkkää kysymystä, vaikka tiedossa olisi oikea vastaus.

Esittelyvideolla o1 työstää vastausta 30 sekuntia ennen kuin se antaa vastaukseksi, että prinsessan ikä on 4/3 prinssin iästä. Eli jos prinssi on esimerkiksi 12-vuotias, niin prinsessa on 16-vuotias.

Open AI kertoo, että o1-malli kykenee tuottamaan tämänkaltaisia loogisia vastauksia sisäisen ajatusketjun ansiosta.

Suomen kielen suurimman kielimallin kehittäneen TurkuNLP:n jäsen Turun yliopiston tietotekniikan laitoksen yliopistotutkija Sampo Pyysalo huomauttaa, että kielimalleista puhuttaessa termit ”päättely” ja ”ajatusketju” pitää laittaa lainausmerkkeihin.

– Mutta se on selvä, että tulosten perusteella malli näyttää selviytyvän joistain teknisistä ja tieteellisistä tehtävistä – jotka edellyttäisivät ihmisiltä päättelyä – paremmin kuin edelliset mallit, Pyysalo sanoo.

Rakkaalla lapsella on monta nimeä

Open AI:n uudesta mallista on huhuttu jo pitkään. Kun yhtiön toimitusjohtaja Sam Altman erotettiin väliaikaisesti viime marraskuussa, uutistoimisto Reutersin haastattelemat lähteet kertoivat erottamisen syyksi uuden tekoälymallin, jonka vaaroista Altman ei välittänyt.

Tuolloin mallia kutsuttiin Q*:ksi (Q-Star). Reutersin lähteiden mukaan useat Open AI:n tutkijat olivat allekirjoittaneet yhtiön hallitukselle lähetetyn kirjeen, jossa varoitettiin Q*-mallin olevan uhka ihmiskunnalle. Tutkijoiden mukaan tehokas malli oli merkittävä askel kohti ihmisajatteluun kykenevää yleistä tekoälyä.

Sen enempää tietoja Q*-mallista ei herunut julkisuuteen. Spekulaatiot Q*:n ympärillä laimenivat, kun Altman palasi Open AI:n johtoon ja yhtiö julkisti uusia kielimalleja, jotka olivat aikaisempia kyvykkäämpiä, mutta eivät osoittaneet uhkaa ihmiskunnalle.

Heinäkuussa Reuters uutisoi, että Q* oli saanut uudeksi nimekseen Project Strawberry eli mansikka. Uuden mallin kerrottiin kykenevän tuottamaan vastauksia monimutkaisiin ongelmiin, joiden ratkaisussa aiemmat mallit epäonnistuivat. Mansikka kykeni tekemään päättelyketjuja.

Syyskuussa Mansikka sai viralliseksi nimekseen o1. Open AI:n mukaan o1 ei ole jatkoa yhtiön viimeisimmälle GPT-4o -mallille (jossa pieni o-kirjain merkitsee omnia, eli yleismaallista). Sen sijaan o1 on aivan omanlaisensa malli. Siksi yhtiö halusi nollata asteikon ja aloittaa uuden mallin kanssa asteikon alusta. Siksi nimeksi tuli o1.

Open AI ei avaa uuden mallinsa toimintaa

Ajatusketjuja hyödyntäviä malleja on kehitetty aikaisemmin, mutta Open AI on Pyysalon mukaan saanut mallistaan enemmän irti kuin muut.

Open AI:n o1:n arviointi on kuitenkin hankalaa, sillä nimestään huolimatta Open AI ei ole avannut uuden mallinsa taustoja kovinkaan avoimesti.

– Koulutusprosessi vaikuttaa olevan tässä mallissa keskeisin uusi asia, ja se on myös se osa, josta Open AI kertoo kaikista vähiten, Pyysalo toteaa.

Julkistuksen yhteydessä Open AI mainitsi vahvistusoppimisen, joka on tekoälyjärjestelmien kehittämisessä käytetty menetelmä. Tätä menetelmää on käyttänyt esimerkiksi hakukoneyhtiö Google, kun se rakensi Go-peliä pelaavan tekoälyjärjestelmän Alpha Go:n.

Vahvistusoppimisessa mallia ei koulutusvaiheessa ohjata kohti oikeaa vastausta tai siirtoa, vaan sen annetaan päätyä ratkaisuunsa. Vasta tämän jälkeen sille kerrotaan, oliko ratkaisu oikea vai ei.

AlphaGo:n tapauksessa malli pelasi miljoonia pelejä, joiden lopputulos selvisi vasta viimeisen siirron jälkeen. Tällä tavalla harjoitettu malli lopulta ylitti ihmistason pelissä.

Go-mestari Ke Jie pelaamassa Googlen AlphaGo-tekoälyä vastaan. — Googlen DeepMind-tekoälylaboratorion kehittämä AlphaGo voitti kolmesti maailman parhaan go-pelaajan, kiinalaisen Ke Jien keväällä 2017. Pelien jälkeen Ke kuvaili AlphaGo:ta go-pelin jumalaksi. Kuva: EPA

– Vaikuttaa siltä, että o1 on koulutettu siten, ettei se yritä suoraan vastata, vaan se tuottaa tällaisen ikään kuin ajatusketjun siitä, miten tämä ongelma voitaisiin ratkaista.

Tämän ansiosta malli kykenee aloittamaan alusta, jos se huomaa päätyneensä väärään ratkaisuun. Perinteiset kielimallit eivät tähän kykene, vaan ne tuottavat suoraan vastauksen ilman ”päättelyä”.

Ero tulee hyvin esille esimerkillä ristisanatehtävästä. Siinä missä aikaisemmat kielimallit ikään kuin täyttävät ristikon kuulakärkikynällä, o1 käyttää lyijykynää. Se tarkistaa vastauksen ja näyttää käyttäjälleen, kuinka se päätyi vastaukseen.

– Tyypilliset kielimallit vastaavat ikään kuin puhtaasti intuition perusteella, ja jos ensimmäinen intuitio ei ole oikein, niin vastaus jää vääräksi, Pyysalo sanoo viitaten Nobel-voittaja psykologi Daniel Kahnemanin jaotteluun nopean, intuitiivisen ajatusjärjestelmän ja hitaamman, loogisemman ajatusjärjestelmän välillä.

Tekoäly polttaa miljardeja dollareita

Vaikuttavista esimerkeistä huolimatta Pyysalo ei pidä o1:stä Open AI:n mainostamana teknologisena mullistuksena, vaan enemmänkin yhtenä kehitysaskeleena, joita kielimallit ovat viime vuosien aikana ottaneet useita.

– Tässä on selvästi otettu teknisiä edistysaskeleita, mutta ehkä niitä merkittävämpää on kuitenkin se, miten tehokkaasti malli on pystytty toteuttamaan, miten eri tekniikoita on tuotu yhteen ja miten se on muokattu tuotteeksi, Pyysalo sanoo.

Open AI:illa ja Altmanilla on kuitenkin hyvä syy markkinoida uutta malliaan mullistavana loikkana: raha.

Tekoälymallien kouluttaminen ja pyörittäminen vaatii valtavia summia rahaa. Open AI kertoi syyskuun alussa saavuttaneensa miljoonan maksavan yritysasiakkaan rajapyykin. Yhtiö aikoo myös nostaa hintoja.

Nämä eivät kuitenkaan millään riitä kattamaan uusien mallien kouluttamiseen uppoavia kuluja. Tekoäly-yhtiö Anthropicin toimitusjohtaja Dario Amodei totesi kesällä, että nyt kehitteillä olevien mallien koulutus maksaa jopa miljardi dollaria.

Tämän takia Open AI hakee nyt rahoitusta sijoittajilta. Lisäksi yhtiö neuvottelee pankkien kanssa viiden miljardin dollarin luotosta.

Tässä tilanteessa Altmanin on hyödyllistä maalata kuvaa teknologisesta mullistuksesta, joka tuo koko ihmiskunnalle ennennäkemätöntä vaurautta.

– Vaikka se tapahtuukin asteittain, hämmästyttävistä saavutuksista – kuten ilmaston korjaaminen, siirtokuntien perustaminen avaruuteen ja kaikkien fysiikan salaisuuksien löytäminen – tulee lopulta arkipäiväisiä. Lähes rajattoman älykkyyden ja runsaan energian avulla – kyvykkyydellä kehittää hienoja ideoita ja toteuttaa ne – voimme tehdä paljon, Altman hehkuttaa kirjoituksessaan.

Turun yliopiston tietotekniikan laitoksen yliopistotutkija Sampo Pyysalo suhtautuu kielimalleihin pragmaattisemmin.

– Teknologian puolella ei ole tullut ratkaisevia murroksia. Paljon on otettu pieniä ja osittain hyvin merkittäviäkin edistysaskeleita, mutta jään vielä odottamaan, että saadaan kategorisesti kykenevämpiä malleja, Pyysalo pohtii.

– Uskaltaisinko sanoa, että ehkä eniten yllättää se, miten vähän on tapahtunut teknologiassa ottaen huomioon sen, kuinka paljon tämän ympärillä häärää ihmisiä.

Kuuntele Räjäytyskuva-podcastin kausi tekoälystä:

Tekoäly, hype ja lupaus