ChatGPT, muut kielimallit ja tekoäly

KalleH · Joulukuu 12, 2022, 6.04am

ChatGPT myös osaa muokata ja iteroida koodia. Jos koodi vastaukset perustuisivat suoraan plagiointiin ennä uskoisi tämän olevan mahdollista.
Osaa myös tehdä saman koodin kaikilla kielillä.

OldFeki · Joulukuu 12, 2022, 6.06am

AI:n ohjelmoinnin osaamisen tavallaan ymmärtää, sillä ohjelmoinnissa säännöt ovat hyvin selkeät. Pelkkä suomen kielen osaaminen on jo paljon hämmästyttävämpää. Kyselin ChatGPT:ltä itseltään asiasta ja hän vakuutti, että mitään käännöksiä ei lennosta tehdä vaan suomi on opittu samalla tavalla kuin englanti.

En ole koodannut työkseni pitkään pitkään aikaan, mutta sen voin sanoa, että jos minulla olisi ollut tällainen apuväline käytössä olisi moni asia ollut paljon helpompaa.

Kokeilin piruuttani ChatGPT:n SAP-osaamista. Ohessa pieni testi:

Kysyin myös koodin kopioimisesta.

Quante · Joulukuu 12, 2022, 6.10am

Niin siis ongelmahan ei tuossa copilotissakaan ole että se kopioisi tietoa, vaan tietyllä syötteellä se antaa ulos koodipätkän sellaisenaan jona se on ollut koulutussetissä. Tuon Quake koodin kohdalla se on helppo tunnistaa sillä kyseessä on kuuluisa koodipätkä, mutta suurempi ongelma on se että yksittäisestä pätkästä voi olla vaikea tietää onko se tullut neoroverkon läpi muuttumattomana.

Edit. Epätäydellinen lähde nyt kun alkuperäinen postaaja on poistamut tilinsä, mutta näyttää siltä että chatgpt on saman koodin antanut vastauksessa.

https://www.reddit.com/r/linux/comments/zfzl5u/chatgpt_when_asked_to_will_output_gpl_licensed/?utm_source=share

KalleH · Joulukuu 12, 2022, 6.21am

Tämä saattaa olla myös syy suoraan kopiointiin. Kyseinen koodin pätkä esiintyy lukemattomia kertoja sellaisenaan mutta kuitenkaan sisältämättä alkuperäistä lisenssiehtoa.
Kun opetusmateriaali sisältää paljon kopioita alkuperäisestä on helppo AI:n kopioida kopiota ymmärtämättä lisenssi seurauksia.
Tätä tapahtuu paljon myös ihmisille. Jos jokin lähtee leviämään viraalisti ei ihmiset tarkista onko alkuperäistä teosta luvallista varioida vaan seuraavat vain muiden esimerkkiä:

AI tuntuu olevan samaa mieltä.

OldFeki · Joulukuu 12, 2022, 6.21am

Tuohon ei kannata luottaa. Luin tästä jo aiemmin ja ilmeisesti koodinpätkän käyttämistä oli erityisesti pyydetty ChatGPT:ltä. Joka tapauksessa koko postaus on vähintäänkin kyseenalainen. Ehkä siksi käyttäjäkin on häipynyt kuvioista.

Jos miettii, mihin tällainen teknologia soveltuisi tulee aika nopeasti mieleen esim. Suomen laki. Kehittyessään teknologia osaisi sekä Suomen lain sisällön kirjaimellisesti että tietäisi sen tulkinnat esimerkkitapausten perusteella. Miettikääpä.

Quante · Joulukuu 12, 2022, 6.34am

AI tuottaa sen kysymällä pelkästään fast inverse squareroot funktiota C:llä kirjoitettuna, stokastisesti tosin ja antaa joitain eri vaihtoehtoja kun kysyy useasti. Kommentteja ei tällöin tosin tule mukana. Kysyessä lisenssistä, vastaa vaan että loppukäyttäjä voi päättää miten lisensoi. Välillä osaa sanoa että antoi ns. Quake algoritmin. Mutta ongelma ei ole se että quake algoritmi vuotaa läpi, vaan se että myös muut voivat vuotaa läpi. Se että tuon käyttö voisi yleistyä vaatisi sen, että yritys voi olla 100% varma että kaiken ulostulevan lisenssi tunnetaan. Oletan että tämän sisällyttäminen olisi mahdollista työllä, mutta tuollaisenaan tuo mahdollinen ”vuoto” on ongelma jota ei kannata väheksyä.

OldFeki · Joulukuu 12, 2022, 6.37am

Ollaan hyvinkin periaatteellisten kysymysten äärellä. Ehkä vähän liiankin syvällisten ottaen huomioon AI:n kyvykkyyden.

Mutta yleisesti ottaen voi myös kysyä, miten yritys voi olla 100% varma, että kaiken työntekijöiden tuottaman koodin lisenssit tunnetaan? Koneelle/AI:lle voisi opettaa lisensoidun koodin tunnistamisen, joten se ei kai olisi ongelma?

Quante · Joulukuu 12, 2022, 6.46am

Totta tuokin. Toinen fundamentaalinen kysymys lienee mikä on liian samanlaista. Lyhyissä koodipätkissä joita chatgpt nyt voi generoida ei kuitenkaan ole paljoa mahdollisuutta variaatiolle.

Tässä kuitenkin aiheeseen liittyvä uutinen viimekuulta.

Ibidem · Joulukuu 12, 2022, 7.27am

Niin no, käytännössä kaikkl ohjelmakoodi on tekijänoikeuden suojaamaa (vähintään muuttujien nimeäminen antaa tilaa luovuudelle ja siten ainakin aiheuttaa vaaran teoskynnyksen ylittymiseen). Siksi koodin kopioiminen mistään lähteestä, on se Stack Overflow tai ChatGPT, on tekijänoikeusrikkomus ellei siihen liity luotettavaa lisensointia. Jos lisenssiä ei ole kerrottu (kuten yleensä on), koodia ei pidä käyttää.

Koodin samanlaisuus ei ole kriteeri, mutta se voi toki olla keskeinen osa tekijänoikeusrikkomuksen tai -rikoksen näyttöä.

Tässä suhteessa AI ei tuo ongelmatiikkaan mitään uutta.

KalleH · Joulukuu 12, 2022, 7.39am

AI voi kyllä olla osa ratkaisua. Mitä tahansa koodia voi verrata monella eri tasolla kaikkeen opetusmateriaalin koodiin. AI voi sitten varoittaa mahdolisista lisenssiongelmista(tahattomista tai tahallisista). Samalla koodia voi verrata vastaaviin ja löytää mahdollisia bugeja tai parannusehdotuksia.

OldFeki · Joulukuu 12, 2022, 7.44am

Varmasti juuri näin. Toisaalta tekoäly voi myös pahentaa ongelmaa löytämällä lisenssiongelmia aiempaa huomattavasti tehokkaammin. Voi olla, että sen seurauksena sääntöjäkin pitää muuttaa – siis jos kaikki lisenssirikkeet yhtäkkiä paljastuvat.

Ibidem · Joulukuu 12, 2022, 7.47am

Noita plagiaatintunnistusvehkeitä on jo ihan kohtuullisesti käytössä, erityisesti akateemisen maailman puolella. Sitä en osaa sanoa kuinka paljon niissä käytetään AI-teknologioita.

Juippi · Joulukuu 12, 2022, 9.41am

Ensin pyysivät sähköpostia. Sitten sähköpostin varmistamista. Sitten kun sähköposti oli varmistettu, yllättäen pyysivät vielä puhelinnumeroakin. Enpä jäänyt odottamaan että olisiko puhelinnumeron syöttämisen jälkeen vielä kuva passista pitänyt lähettää. Petollinen tiedonkalastelusivusto.

OldFeki · Joulukuu 12, 2022, 9.54am

Ex-ammattilaisena voin vakuuttaa, että rekisteröitymisessä sinänsä ei ole mitään vaarallista. Mutta tarkkuus on toki erittäin hyvä asia.

Potentiaalisesti paljon suurempi kysymysmerkki on itse palvelun käyttö. Tässä vaiheessa en usko tiedon keräämiseen Googlen tai Metan lailla, mutta joskus tulevaisuudessa kanssakäyminen tällaisen tekoälyn kanssa olisi kultakaivos tahoille, jotka haluavat hyötyä yksityiskohtaisesta tiedosta liittyen kiinnostuksesi kohteisiin ja elämään ylipäänsä. Toisaalta, moni meistä on jo luovuttanut kaiken tiedon itsestään teknojättien hyväksikäytettäväksi – eikä sille aina edes voi mitään.

monni2 · Joulukuu 12, 2022, 10.04am

Omat kokeiluni ovat varsin vaihtelevia. Tiettyihin asioihin osasi vastata jopa hämmentävän hyvin, kun taas toisiin aika helppoihinkin asioihin vastasi täysin vakuuttavan oloisesti aivan täyttä puppua. Tuossa totta tosiaan on paljon riskejä, jos alkaa luottamaan näihin itsevarman oloisiin vastauksiin sokeasti.

Ei myöskään suostunut kertomaan kuka ampui Mainilan laukaukset, vaan taiteili “diplomaattisesti” jotain siitä, kuinka asia on kiistanalainen…

OldFeki · Joulukuu 12, 2022, 10.19am

Hauska seurata ChatGPT:n ympärillä käytävää keskustelua. Kuuluisa Oxfordin fyysikko (atomi- ja laserfysiikkaa, kvanttilaskentaa ja kaikkea muuta helposti ymmärrettävää) ja Sam Altman (OpenAI/ChatGPT CEO) sopivat treffejä Twitterissä keskustellakseen yleisestä tekoälystä (AGI).

Kale-possu · Joulukuu 12, 2022, 10.40am

Kyselin englanniksi, miksi Neuvostoliitto salli Suomen säilyä itsenäisenä markkinatalousmaana kylmän sodan aikana. Pohjana tälle oli taannoin mainitsemani diplomaatti Max Jakobsonin muistelmateos, jossa hän kertoo, miten pääsi vuonna 1961 Air Force Onen kyytiin. Kesken lennon hänelle tultiin sanomaan, että presidentti Kennedy ottaa nyt vastaan. Jakobson odotti lyhyttä, muodollista kättelyseremoniaa. Sen sijaan Kennedy ohjasi hänet istumaan ja alkoi uteliaasti tentata tätä kaikesta mahdollisesta Suomeen liittyvästä. Eniten Kennedyä kiinnosti tuo tekoälyltä kysymäni kysymys. Jakobson jakoi vastauksensa kolmeen pointtiin. Keskeisimpänä oli Suomen raivoisa sotilaallinen puolustautuminen ja Neuvostomiehityksen estäminen. Toisena oli hyvin herkkä maailmanpoliittinen tilanne vuonna 1948, kun Neuvostoliitto vaati Suomea YYA-sopimukseen, ja tämä vaikutti Suomen kannalta hyvin pehmeään soppariin. Kolmantena Jakobson nosti suomalaisen demokratian elinvoiman, joka oli aina hyljeksinyt totalitaristisia suuntauksia.

AI:n vastaus jäi pehmeäksi pyörittelyksi, jossa Suomella ei nähty olevan minkäänlaista valtaa omaan kohtaloonsa. Pääsyyksi AI näki, että Neuvostoliitto ei halunnut riskeerata sotaa lännen kanssa. Neuvostoliitto sai myös kontrolloitua Suomea ja pitämään sen samalla ystävällismielisenä naapurina.

Vastasin, että länsi ei olisi todellakaan alkanut sotimaan jos Suomi oltaisiin 1948 painettu väkisin kommunistiseksi satelliitiksi. Toki Ruotsi olisi luultavasti liittynyt Natoon tai ainakin saanut avoimemmin turvatakuut USA:lta. Kritisoin AI:ta naiivista vastauksesta ja viittasin Suomen puolustustaisteluun ja venäläiseen mentaliteettiin, jossa ymmärretään ja kunnioitetaan raakaa voimaa. Se myönsi, että ”Suomen puolustustaistelulla saattoi olla vaikutusta”. Paalutin ärsyyntyneenä, että sillä oli iso merkitys. Jäimme näihin poteroihin.

pt99659 · Joulukuu 12, 2022, 11.34am

Pitihän tätä kokeilla, kun niin paljon kohkataan eri puolilla somea.

Osa vastauksista hämmästyttävän hyviä, osa puppugeneraattorin suoltamaa soopaa (tosin uskottavan kuuloista). Jos taustalla pyörivää AI:ta kehittäisi sopivien aineistojen avulla tiettyjen alojen asiantuntijaksi, lopputulos olisi luultavasti erinomainen. Ensimmäistä kertaa vuosiin on tunne, että tässä voisi olla googlen hakukoneen tappaja. Tai ehkä todennäköisemmin Google adaptoi vastaavan chatbot-ai:n omaan hakukoneeseen.

Suomen kieli toimii yllättävän hyvin, mutta erikoissanastossa on paikoin käännösvirheitä.

Aivan varmasti ChatGPT:n teknologia tulee yleistymään monilla eri aloilla. Kyllähän tämä on hieno innovaatio ja teknologinen hyppäys eteenpäin. Ja toivottavasti kenenkään ei tarvitse enää kirjoittaa korkeakoulussa x sivun puppuesseetä, kun tekoäly voi pyöräyttää sellaisen parissa sekunnissa.

KohtiVapautta · Joulukuu 12, 2022, 12.55pm

Juu, kokeilin minäkin tuota ja hyvin samankaltaisia ajatuksia.

Eli suoltaa aiheesta kuin aiheesta ihan järkevän kuuloista tekstiä, mutta ei todellakaan kannata luottaa sen antamiin kaikkiin vastauksiin.

Vaikuttaisi siltä että etenkin ohjelmoinnin puolella selkeästi kyvykkäämpi, mutta esimerkiksi virtausmekaniikan puolella vastaukset olivat jo selkeästi yleisluonteisempia. Toki kysymyksen asettelullakin on merkitystä kun haetaan täsmällisempää tietoa (etenkin alueilta jotka ei sisälly koulutusdataan). Pointti siis tässä on ettei tämä yleinen kielimalli ole ihan vielä pätevä kaikkien alojen asiantuntija.

Mutta itse keskustelussahan tuo vaikuttaa pikaisella testaamisella melko pätevältä. Ja tämähän on tuon mallin varsinainen idea. Tosin mietin kuinka hyvin sopivasti ohjatulla keskustelulla malli saadaan tuottamaan ristiriitaisia vastauksia? Ja miten se tällaiseen mahdollisesti reagoi? Eli onko ideoita aiheesta, jossa tuollainen voisi tulla eteen? Uskoisin että kaikki etiikan ja moraalin klassiset esimerkit ovat koulutusdatassa mukana?

Edit: jatkoin kokeilua ja kysyin ensin pystyykö keskustelemaan moraalista ja etiikasta ja vastaus oli ei. Valittelee olevansa vain malli luonnollisesta ja lukijaystävällisestä kielestä.

Ja tuonkin malli määrittää melko suppeasti:
"Mahdollisimman luonnollinen ja lukijaystävällinen teksti voi sisältää oivaltavia ja humoristisia elementtejä, mutta ne eivät ole välttämättömiä. Tärkeintä on, että teksti on selkeää ja helppolukuista, ja että siinä on käytetty luonnollista kieltä ja ilmaisutapoja. Tekstin tulee myös noudattaa kielioppia ja sääntöjä, ja käyttää oikeita sanoja ja ilmaisuja oikeissa yhteyksissä.

Oivaltavuus ja huumori ovat makuasia, ja ne vaihtelevat ihmisittäin. Jokainen lukija voi pitää eri asioista oivaltavina tai huumorillisina, ja siksi on vaikea määritellä, mikä teksti on humoristista tai oivaltavaa. Minun tehtäväni on auttaa käyttäjiä tuottamaan tekstiä, joka on mahdollisimman luonnollista ja lukijaystävällistä, ja teen parhaani täyttääkseni tämän tehtävän parhaalla mahdollisella tavalla. Olen pahoillani, jos en pysty auttamaan sinua tuottamaan oivaltavaa tai humoristista tekstiä."

OldFeki · Joulukuu 12, 2022, 7.05pm

Ensimmäisiä yleiseen tietoon tulleita käytännön sovelluksia.