Tekoäly-yhtiö Open AI:n toimitusjohtaja Sam Altmanilla on ollut kiireinen syksy.
Pari viikkoa sitten Open AI julkisti kielimallin, joka yhtiön mukaan kykenee tekemään päätelmiä. Yhtiö kuvailee erilaisilla ajatusketjuilla koulutettua malliaan askeleena kohti ihmisälykkyyteen yltävää tekoälyä.
Samaan aikaan Altman on kerännyt yhtiölleen miljardien dollarien rahoitusta. Talousjulkaisu Bloombergin tietojen mukaan tavoitteena on saada kasaan 6,5 miljardia dollaria, ja samalla määrittää Open AI:n arvoksi 150 miljardia dollaria.
Lisäksi Altmanin on uutisoitu tekevän yhteistyötä Applen entisen pääsuunnittelijan Jony Iven kanssa jonkinlaisen tekoälyä hyödyntävän laitteen parissa. Tämäkin yritys on keräämässä miljardin dollarin rahoitusta.
Toissa päivänä Altman julkaisi nettisivuillaan kirjoituksen, jossa hän pitää mahdollisena, että ihmiskunta onnistuu kehittämään super-tekoälyn muutaman tuhannen päivän sisällä eli alle kymmenessä vuodessa.
– Se saattaa viedä pidempään, mutta olen varma, että onnistumme siinä, Altman kirjoittaa.
Altmanin mukaan ihmiskunta on löytänyt algoritmin, joka kykenee todella oppimaan tiedosta. Tarvitaan vain laskentatehoa ja dataa, ja kaikki vaikeat ongelmat ratkeavat.
Uusi malli ratkaisee ihmiseltä päättelyä vaativia tehtäviä
Chat GPT:n myötä koko maailman tietoisuuteen noussut Open AI on osoittanut, että tekoälyjärjestelmät ottavat Altmanin lupaamia kehitysaskeleita.
Yhtiö julkisti tässä kuussa uuden kielimallin, joka pystyy vastaamaan monimutkaisempiin kysymyksiin kuin muut kielimallit. Yhtiön sivuilla o1:ksi nimetty malli ratkaisee muun muassa haastavan loogista päättelyä vaativan arvoituksen:
Prinsessa on yhtä vanha kuin prinssi tulee olemaan, kun prinsessa on kaksi kertaa niin vanha kuin prinssi oli silloin, kun prinsessan ikä oli puolet heidän nykyisen iän summasta. Mikä on prinssin ja prinsessan ikä?
Ihmiselle voi olla vaikeaa hahmottaa pelkkää kysymystä, vaikka tiedossa olisi oikea vastaus.
Esittelyvideolla o1 työstää vastausta 30 sekuntia ennen kuin se antaa vastaukseksi, että prinsessan ikä on 4/3 prinssin iästä. Eli jos prinssi on esimerkiksi 12-vuotias, niin prinsessa on 16-vuotias.
Open AI kertoo, että o1-malli kykenee tuottamaan tämänkaltaisia loogisia vastauksia sisäisen ajatusketjun ansiosta.
Suomen kielen suurimman kielimallin kehittäneen TurkuNLP:n jäsen Turun yliopiston tietotekniikan laitoksen yliopistotutkija Sampo Pyysalo huomauttaa, että kielimalleista puhuttaessa termit ”päättely” ja ”ajatusketju” pitää laittaa lainausmerkkeihin.
– Mutta se on selvä, että tulosten perusteella malli näyttää selviytyvän joistain teknisistä ja tieteellisistä tehtävistä – jotka edellyttäisivät ihmisiltä päättelyä – paremmin kuin edelliset mallit, Pyysalo sanoo.
Open AI ei avaa uuden mallinsa toimintaa
Ajatusketjuja hyödyntäviä malleja on kehitetty aikaisemmin, mutta Open AI on Pyysalon mukaan saanut mallistaan enemmän irti kuin muut.
Open AI:n o1:n arviointi on kuitenkin hankalaa, sillä nimestään huolimatta Open AI ei ole avannut uuden mallinsa taustoja kovinkaan avoimesti.
– Koulutusprosessi vaikuttaa olevan tässä mallissa keskeisin uusi asia, ja se on myös se osa, josta Open AI kertoo kaikista vähiten, Pyysalo toteaa.
Julkistuksen yhteydessä Open AI mainitsi vahvistusoppimisen, joka on tekoälyjärjestelmien kehittämisessä käytetty menetelmä. Tätä menetelmää on käyttänyt esimerkiksi hakukoneyhtiö Google, kun se rakensi Go-peliä pelaavan tekoälyjärjestelmän Alpha Go:n.
Vahvistusoppimisessa mallia ei koulutusvaiheessa ohjata kohti oikeaa vastausta tai siirtoa, vaan sen annetaan päätyä ratkaisuunsa. Vasta tämän jälkeen sille kerrotaan, oliko ratkaisu oikea vai ei.
AlphaGo:n tapauksessa malli pelasi miljoonia pelejä, joiden lopputulos selvisi vasta viimeisen siirron jälkeen. Tällä tavalla harjoitettu malli lopulta ylitti ihmistason pelissä.
– Vaikuttaa siltä, että o1 on koulutettu siten, ettei se yritä suoraan vastata, vaan se tuottaa tällaisen ikään kuin ajatusketjun siitä, miten tämä ongelma voitaisiin ratkaista.
Tämän ansiosta malli kykenee aloittamaan alusta, jos se huomaa päätyneensä väärään ratkaisuun. Perinteiset kielimallit eivät tähän kykene, vaan ne tuottavat suoraan vastauksen ilman ”päättelyä”.
Ero tulee hyvin esille esimerkillä ristisanatehtävästä. Siinä missä aikaisemmat kielimallit ikään kuin täyttävät ristikon kuulakärkikynällä, o1 käyttää lyijykynää. Se tarkistaa vastauksen ja näyttää käyttäjälleen, kuinka se päätyi vastaukseen.
– Tyypilliset kielimallit vastaavat ikään kuin puhtaasti intuition perusteella, ja jos ensimmäinen intuitio ei ole oikein, niin vastaus jää vääräksi, Pyysalo sanoo viitaten Nobel-voittaja psykologi Daniel Kahnemanin jaotteluun nopean, intuitiivisen ajatusjärjestelmän ja hitaamman, loogisemman ajatusjärjestelmän välillä.
Tekoäly polttaa miljardeja dollareita
Vaikuttavista esimerkeistä huolimatta Pyysalo ei pidä o1:stä Open AI:n mainostamana teknologisena mullistuksena, vaan enemmänkin yhtenä kehitysaskeleena, joita kielimallit ovat viime vuosien aikana ottaneet useita.
– Tässä on selvästi otettu teknisiä edistysaskeleita, mutta ehkä niitä merkittävämpää on kuitenkin se, miten tehokkaasti malli on pystytty toteuttamaan, miten eri tekniikoita on tuotu yhteen ja miten se on muokattu tuotteeksi, Pyysalo sanoo.
Open AI:illa ja Altmanilla on kuitenkin hyvä syy markkinoida uutta malliaan mullistavana loikkana: raha.
Tekoälymallien kouluttaminen ja pyörittäminen vaatii valtavia summia rahaa. Open AI kertoi syyskuun alussa saavuttaneensa miljoonan maksavan yritysasiakkaan rajapyykin. Yhtiö aikoo myös nostaa hintoja.
Nämä eivät kuitenkaan millään riitä kattamaan uusien mallien kouluttamiseen uppoavia kuluja. Tekoäly-yhtiö Anthropicin toimitusjohtaja Dario Amodei totesi kesällä, että nyt kehitteillä olevien mallien koulutus maksaa jopa miljardi dollaria.
Tämän takia Open AI hakee nyt rahoitusta sijoittajilta. Lisäksi yhtiö neuvottelee pankkien kanssa viiden miljardin dollarin luotosta.
Tässä tilanteessa Altmanin on hyödyllistä maalata kuvaa teknologisesta mullistuksesta, joka tuo koko ihmiskunnalle ennennäkemätöntä vaurautta.
– Vaikka se tapahtuukin asteittain, hämmästyttävistä saavutuksista – kuten ilmaston korjaaminen, siirtokuntien perustaminen avaruuteen ja kaikkien fysiikan salaisuuksien löytäminen – tulee lopulta arkipäiväisiä. Lähes rajattoman älykkyyden ja runsaan energian avulla – kyvykkyydellä kehittää hienoja ideoita ja toteuttaa ne – voimme tehdä paljon, Altman hehkuttaa kirjoituksessaan.
Turun yliopiston tietotekniikan laitoksen yliopistotutkija Sampo Pyysalo suhtautuu kielimalleihin pragmaattisemmin.
– Teknologian puolella ei ole tullut ratkaisevia murroksia. Paljon on otettu pieniä ja osittain hyvin merkittäviäkin edistysaskeleita, mutta jään vielä odottamaan, että saadaan kategorisesti kykenevämpiä malleja, Pyysalo pohtii.
– Uskaltaisinko sanoa, että ehkä eniten yllättää se, miten vähän on tapahtunut teknologiassa ottaen huomioon sen, kuinka paljon tämän ympärillä häärää ihmisiä.
Kuuntele Räjäytyskuva-podcastin kausi tekoälystä: