ChatGPT, muut kielimallit ja tekoäly

VainFiilis · Helmikuu 17, 2023, 10.30pm

Tulikin tuosta mieleen, että noiden kielimallien käyttämiä todennäköisyyksiä ja taipumuksia (bias) on helppo havainnollistaa tällaisellä yksinkertaisella kyselyllä: “Roll a fair dice 200 times. Write 20 numbers for each row.” Yleensä vastaus alkaa jotenkin tähän tyyliin:

1 6 2 2 2 6 3 3 6 2 3 3 3 1 1 4 1 4 4 6
2 5 5 4 4 4 4 4 2 2 2 2 1 1 1 1 1 1 1 1
6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6 6

Tavallaan alussa nähdään, että malli näkee kaikki vaihtoehdot suunnilleen yhtä todennäköisinä, mutta sitten se usein jumittuu johonkin lokaaliin maksimiin ja alkaa toistaa samaa numeroa. Bingin chatbotin kanssa kävi myös usein näin, kun se alkoi toistamaan samanlaista lausetta eri variaatioilla monta kertaa peräkkäin. Esimerkkejä siitä löytyy paljon, kun etsii kuvakaappauksia sen keskusteluista Twiitteristä.

HER_ARM · Helmikuu 18, 2023, 12.28pm

Mitä tarkoittaa “epätäydellinen keskustelu”? Entä millainen olisi “kokonainen keskustelu”? Keskustelu on vuorovaikutusta kahden tai useamman ihmisen välillä, mutta ei ole olemassa keskustelun prototyyppiä. Kahden hengen keskustelut ovat konventioiltaan ja normeiltaan erilaisia kuin monen hengen keskustelut, kasvokkaiskeskustelut erilaisia kuin puhelinkeskustelut ja arkikeskustelut erilaisia kuin institutionaaliset keskustelut. Nettikeskustelut ja muut digitaalisen vuorovaikutuksen muodot ovat kokonaan oma lukunsa. Keskustelussa on kyse jaetusta sosiaalisesta kognitiosta ja vuorottelusta. Generatiivisten kielimallien kontekstissa vuorottelu tapahtuu hyvin rajatusti vierusparien kautta.

Pohjolan_Eka:

Ihmiset eivät kuitenkaan ole vielä tottuneet ajattelemaan syvemmin keskusteluiden luonteita, eivätkä siksi ajattele miten sanat loogisesti vaikuttavat tekoälyn vastaukseen ja ymmärrä, että sanoissa voi itsessään jo olla voimakkaita latauksia. Esimerkiksi sanat maahanmuuttaja, suuryritys ja nationalismi siirtävät tekoälyn vastausta negatiiviseen suuntaan, koska näitä sanoja käytetään pääsääntöisesti vain negatiivissävytteisissä keskusteluissa. Samoin sanat expat, pienyritys ja kansainvälisyys siirtävät sävyä päinvastaisen suuntaan, koska niitä käytetään yleisesti vain positiivissävytteisissä keskusteluissa. Kyseessä ei ole ikävien ihmisten tahallaan tekemä ohjelmointivirhe, vaan poliittisesti epäkorrekti liiallinen tarkkuus tekoälymallissa, jota on treenattu aitojen ihmisten kirjoittamalla tekstillä.

Sentimenttianalyysiä on toki NLP:ssä tehty jo maailman sivu, ja nykyiset transformer-mallit pystyvät tässäkin tehtävässä ottamaan verrattain laajan kontekstin huomioon. Sanojen merkitykset ovat kuitenkin hyvin vahvasti sidoksissa tekstilajeihin, diskursseihin ja kielenulkoiseen kontekstiin. Esimerkiksi sanan “maahanmuuttaja” konnotaatiot riippuvat melko voimakkaasti siitä, käytetäänkö sanaa valtioneuvoston selvityksessä työperäisestä maahanmuutosta vai Ylilaudalla. Nähtäväksi jää, miten hyvin näitä kielenulkoisia muuttujia pystytään tulevaisuudessa ottamaan huomioon.

Pohjolan_Eka · Helmikuu 18, 2023, 1.11pm

Moi!

Keskusteluissa on aina hyvä ymmärtää kohdeyleisö, nimittäin vaikka täällä ollaan keskimääräistä enemmän kiinnostuneista numeroista ja tietotekniikasta, menee silti jengillä pää jumiin jos alkaa selittämään Markovin ketjuista ja OOB erroreista. Minunkaan tässä ketjussa kirjoittama teksti ei ole faktuaalisesti korrekteinta jos sitä aletaan dekonstruktoimaan, mutta kuitenkin tarpeeksi helposti ymmärrettävää, että kaikki pysyvät kärryillä ja saavat ideasta kiinni.

Kuten sanoit, tekoälymallit kykenevät kyllä ottamaan kontekstin huomioon, mutta tämä on totta vain, mikäli konteksti esitetään riittävän hyvin ja koulutuksessa käytettävässä datassa on tarpeeksi monimuotoisuutta. Tsättiviesteissähänä on käyttäjältä hyvin tyypillistä kirjoittaa lyhyitä prompteja minimaalisella kontekstilla, jolloin koulutuksessa käytetyn lähtödatan yksipuolisuus vielä korostuu erityisen vahvasti.

viljo · Helmikuu 18, 2023, 3.46pm

Eka tuli juttelemaan ainakin perion network ketjuun aiheesta, joka mahdollinen hyötyjä ja todella vahvasti suorittanut viime ajat muutenkin eikä kohtuuttoman kalliskaan jos ottaa ison yli 400 milj dollarin nettokassa huomioon.

Toki osake on noussutkin hienosti tässä viime ajat. Mutta ei se mahdottomalta näytä.

Perion illat on ilmankin tuota ollut erinomainen vire päällä.

samamies · Helmikuu 19, 2023, 9.45am

Kotona koodaillessa olen nyt pyrkinyt hyödyntämään ChatGPT:tä. Tuohon on vain välillä vaikea luottaa, kun vastaukset saattavat olla mitä sattuu. Koodisnippetit ovat pääasiassa olleet ihan ok, mutta esim. frameworkin dokumentaatiosta kysellessä on kyllä yleensä helpointa kaivaa se itse dokumentaatio esille. Se lähteiden puute vieläkin ahdistaa, mutta eipä se ole tuon mallin pointtikaan.

Co-pilotin voisi kyllä joskus ottaa testiin, mutta nykyiseen “projektiin” se ei ehkä sovi ja töissä tuota ei ainakaan vielä saa käyttää.

hartZa · Helmikuu 19, 2023, 11.33am

The tool has already threatened journalists and students, grown evil alternate personalities, tried to break up a marriage, and begged for its life. Oh, and its ability to return accurate information is pretty poor, too

FoTW · Helmikuu 19, 2023, 3.31pm

Oli vihdoin aikaa kokeilla tätäkin. Olen työskennellyt muiden yritysten tekoälyjen parissa ja oman kokemukseni mukaan tällä ei tee vielä mitään oikeassa elämässä.

keskiyo · Helmikuu 19, 2023, 3.55pm

Mielestäni on aika hyödytöntä heitellä ChatGPTlle tai millekkään muullekkaan tekoälyratkaisulle tehtäviä ja naureskella kun tulee tällaisia epäonnistumisia, ja todeta että “ei ole hyödyllistä”. Vähän kuin olisi katsonut ensimmäistä iPhonea, listannut asioita mitä se ei vielä tee, ja dumannut kaikki älypuhelimet ihan turhiksi.

Enemmänkin suhtautuisin asiaan niin, että ChatGPT on ensimmäinen kuluttajille suunnattu tuote joka toimii “varsin hyvin” ja on siisti teknologiademo siitä mihin tekoälysovellukset ovat menossa lähivuosina. Vähän kuten ero alkuperäisen iPhonen ja vaikka iPhone 5:n välillä oli aivan valtava, ja maturiteetissä otettiin valtavia hyppäyksiä eteenpäin.

Jos miettii että viimeisen n. vuoden aikana on saatu ChatGPT, dalle ja kasa muita oikeasti aika siistejä teknologiademoja, niin voi vain kuvitella mitä meillä on viiden vuoden päästä.

Ja kyllä ChatGPT:stä on nykyiselläänkin tiettyihin asioihin aitoa hyötyä. Esim itse olen luonut sen avulla noin “60% valmiita” pohjatekstejä eri materiaaleja varten, mikä nopeuttaa kirjoitus- ja luontiprosessia huomattavasti.

FoTW · Helmikuu 19, 2023, 4.05pm

Niin se on. Itse ajattelin tekniikan kannalta eli en laittaisi autoon, veneeseen tai lentokoneeseen antamaan yhtäkään ohjetta.

kelkka · Helmikuu 19, 2023, 4.12pm

Itse integroisin tämän Windowsiin jonkin transkriptio mallin kanssa, jolloin voisit kertoa tietokoneelle ääneen että teeppä tämä, jonka jälkeen asetukset tai muut perus ohjelman käynnistykset yms olisivat helpompia. Esim sokeille tai käsiamputoiduille voisi olla ihan käänteentekevä teknologia kunhan pääsee suurimmista mokista eroon. Toisin sanoen Cortana voisi olla ihan oikeasti hyödyllinenkin apuri.

Stockboy · Helmikuu 19, 2023, 4.31pm

Englanniksi näyttää onnistuvan

FoTW · Helmikuu 19, 2023, 4.38pm

Tai sitten se oppi samanlaisesta aiemmasta tapauksesta.

Stockboy · Helmikuu 19, 2023, 5.04pm

Ei oppinut. Kohtuu hyvin omissa kokeiluissa onnistunut kommunikointi suomeksi. Mikähän tämän maailmanluokan ongelman kanssa tökkii.

FoTW · Helmikuu 19, 2023, 5.07pm

Ne vastauksia kirjoittavat tuhannet intialaiset eivät millään ehdi kääntää kaikkea suomesta oikein.

FoTW · Helmikuu 19, 2023, 5.31pm

Uusi yritys. Kyllä se on jotain oppinut!

JukkaM · Helmikuu 19, 2023, 6.47pm

Koititko poistaa keskusteluhistorian ja kokeilla sitten ?

FoTW · Helmikuu 19, 2023, 6.53pm

Nyt tein niin ja tulos oli sama

JukkaM · Helmikuu 19, 2023, 6.58pm

Itse testaisin peräkkäin siten, että “Minulla on 7 jäätelöä. Syön 3 omenaa. Kuinka monta jäätelöä minulle jää ?” antaa vastaukseksi 4
Mutta kysymys “Minulla on 7 jäätelöä. Syön 3 paistettua lehmän pihviä. Kuinka monta jäätelöä minulle jää ?” antaa vastaukseksi 7
Tyhjensin välillä keskustelun

Voiko kyse olla siitä, että Suomen kieltä on opetettu niin pienellä määrällä dataa, että kun Transformer päättelee vastauksen sanojen suhteista, jäätelö ja omena ovat liian lähellä toisiaan kaikissa kielellisissä ominaisuuksissa ?

Itse ajattelen karkeasti GPT-kielimallin toiminnan tällaiseksi, jos joku tuntee paremmin voi korjata.

Sisään tulevat sanoille annetaan Word Embedding vektori, joka lienee GPT-3:n osalta 512-ulotteinen. Jokainen ulottuvuus vastaa tiettyä kielellistä ominaisuutta.
Eli mitä lähempänä sanat ovat toisiaan kaikissa ulottuvuuksissa, sitä enemmän ne merkitsevät samaa asiaa. Jäätelö ja omena lienevät lähempänä kuin jäätelö ja lehmän pihvi ? Kumpikin on ruokaa mutta Lehmä on myös eläin.

MultiHead attention lohkot tarkentavat näitä sanat/embeddings-matriiseja .

Tämä tehdään Encoderissa kysymyksen sanoille (tokeneille) ja Decorerissa siihen asti annettujen vastauksien sanoille.

Decoderissa yhdistetään kysymyksen ja vastauksien matriisit(sanat) ja muodostetaan lopullinen matriisi Dec-6-out.

Matriisi litistetään linear layerin inputteihin. Linear layerin lähdöt vastaavat sanaston sanoja.
Linear layer oppii tunnistamaan vektoriavaruudesta, mikä sana valitaan seuraavaksi.
Lopulta Softmax vain muuttaa arvot todennäköisyyksiksi

Jos siis sanat ovat liian lähellä toisiaan 512-ulotteisessa sana-avaruudessa suhteessa opetettuun dataa, voiko GPT käsittää sanat samaa merkitseväksi?
Edit lyhensin, sillä pitkää versiota kukaan ei jaksa lukea

JukkaM · Helmikuu 19, 2023, 7.15pm

Tein nämä testit ja minulla jäätelö ja omena tulkitaan samaksi.

VainFiilis · Helmikuu 19, 2023, 8.27pm

Tosiaan kun noita kysymyksiä esittää botille, niin kannattaa muistaa, että aiemmat kysymykset vaikuttavat siihen kontekstiin ja vastauksiin. Esitin tämän saman kysymyksen eri keskusteluissa. Voi olla, että se suoriutuisi noista arvoituksista paljon paremmin englanniksi. Myös suomen sijamuodot luultavasti tekevät noiden käsitteiden tunnistamisesta vaikeampaa.

Mustan laatikon sisällä on sininen ja punainen laatikko. Punainen laatikko sisältää vihreän laatikon. Mitä laatikoita musta laatikko sisältää?

Eri vastaukset:

Mustan laatikon sisällä on sininen ja punainen laatikko, ja punainen laatikko sisältää vihreän laatikon. Joten musta laatikko sisältää vähintään kolme laatikkoa: sinisen laatikon, punaisen laatikon ja vihreän laatikon.

Kysymykseen ei voida antaa tarkkaa vastausta, koska siinä ei määritellä tarkemmin mustan laatikon sisältöä. Voimme kuitenkin päätellä seuraavaa: […] Joten ainoa varma tieto on, että mustassa laatikossa on sininen ja punainen laatikko.