Tesla - johtava tulevaisuuden autovalmistaja? (Osa 1)

Geoff Hintoniin ja konenäköön liittyen: 2016 lopulla Hinton kertoi puheenvuorossaan, että konenäkö/tekoäly pystyy muutaman vuoden sisään analysoimaan kaikki radiologiset kuvat ja radiologien kouluttaminen tulisi lopettaa.
Nyt on viisi vuotta myöhemmin, satojen kehitysprojektien ja miljardien investointien jälkeen tekoäly merkitys jokapäiväisessä radiologian palvelutuotannossa on mitättömän pieni. Miksi? Koska haasteet ovat samantyyliset kuin FSD:ssa, minkä vuoksi AI-ratkaisujen tarkkuus ja mukautuvuus eivät riitä → ihmisasiantuntija (ja sen kulut, rajoitteet jne) joudutaan pitämään prosessissa. Tekoälykehityksen ja datan näkökulmasta radiologian kuvien analysointi on huomattavasti helpompi ongelma kuin auton ohjaaminen liikenteessä, mutta tosiaan kaukana ollaan edelleen ihmisen korvaamisesta tuolla toimialalla.

5 tykkäystä

Näin tulee varmaan pikkuhiljaa huomattua alalla kuin alalla. Helpot voitot tekoälyn saralla alkaa taas olla syöty ja kiinnostus hiipuu. Tulee taas uusi tekoälytalvi, kun hype laskee ja asia kiinnostaa lähinnä yliopistojen tietojenkäsittelyn laitosten sivukammioissa.

1 tykkäys

Andrej Karpathy jossain videolla kertoi Teslan neuroverkon haastavista kohdista. Niitä oli vaikka tilanne, jossa autossa oli pyöräteline ja siinä polkupyörä jolloin takana tulevan Teslan NN:n oli vaikea hahmottaa tilannetta.
Muita esimerkkejä taisi olla erilaiset liikennevalot. Liikennevalojen kuva voi olla myös tien vieressä olevassa kyltissä.

Kaikki tilanteet olivat sellaisia, jotka ihminen ymmärtää heti, vaikka ei olisi auton pyörätelinettä koskaan nähnytkään.

Oman maallikkokäsitykseni mukaan perusneuroverkko (inputit, hidden layerit ja outputit) on kuitenkin vain keksintö, jolla opetuksen kautta saatavilla painoarvoilla saadaan sisääntulojen ja lähtöjen riippuvuudet vaikka sisääntulojen välillä ei olisi korrelaatiota

Neuroverkot mietitään jokaista tarvetta varten erikseen.

Ihminen kuitenkin kykenee itse oppimaan täysin uusia asioita ja kykenee käyttämään erittäin laajasti mm. omaa muistia hyödyksi. Ihmisen muisti ei käsitä vain kuvia vaan muutakin tietoa eri ajan hetkistä. Neuroverkoissa RNN on kuitenkin myös vain mekaaninen laite eikä vastaa ihmisen muistin käyttöä ajattelussa

Teslan osalta haaste on mielestäni se, että maailmassa on ääretön määrä mainittuja erikoistilanteita.
Laajempien tietojen kuin vain kameran käyttö mielestäni vähentää neuroverkon monimutkaisuuden sekä datan määrän tarvetta.
Jos neuroverkon ei tarvitse tehdä päätöstä vain kuvasta olettamansa liikennevalon perusteella vaan se tietää AV-kartasta missä ja minkä muotoinen liikennevalo on kyseessä, tehtävä helpottuu.

Tai neuroverkon ei tarvitse tehdä päätöstä kameroilla näkemiensä risteyksen muodon perusteella vaan se saa AV-kartasta laajemman alueen risteyksen muodot.
AV-kartassa voi saada myös tiedon mitä reittiä ja millä todennäköisyydellä eri kaistojen autot liikkuvat.

Itse koodaajana sekä koodaajien esimiehenä olen huomannut, että jonkin suppean alan huippulahjakkuudet usein eivät kykene näkemään oman osaamisalueen ulkopuolelle.
Itse olen ajatellut, että Andrej Karpathy on juuri tällainen AI-asioiden guru jonka haaste on ymmärtää laajasti autonomisen liikenteen pitkän aikavälin tavoitetila ja miten Teslan kannattaisi sinne edetä.
Jos olen väärässä, johtuisi se vain siitä, että minulla ei ole riittävästi tietoa ja en näe oman kuplani ulkopuolelle

9 tykkäystä

Niin. Taitaa olla jotain paljon parempaa luvassa kuin radar, vai luuletko oikeasti että Musk ei Brownin tapausta muista? Viime aikoina on puhuttu yksittäisten kuvien sijasta videopohjaiseen arkkitehtuuriin siirtymisestä. No, sen kun spekuloit, kohta on Beta 9 minullakin lapasessa ja voin sitten kertoa miten toimii. Joka tapauksessa sangen koomista kuinka käännät tästä erittäin vahvasta signaalista negatiivisen jutun.

3 tykkäystä

On tietysti, mutta uskon että riittävästi näitä nähtyään neuroverkko pystyy ne tunnistamaan. Tämähän on koko homman pointti. Näytät verkolle riittävästi koiran kuvia, ja se sen jälkeen tunnistaa koirat sellaisita kuvista mitä ei ole koskaan ennen nähnyt. (Huvittavaa muuten, että taaperon tarvitsee nähdä vain yksi koira ja sen jälkeen tunnistaa kaikki koirat. Pitkä matka vielä AGI:hin :slight_smile: ) Sama juttu pyörätelineissä tai ihmisissä jotka kantavat liikennemerkin kuvaa tien vieressä. Tämän takia yrityksen hallussa olevan datan määrä ja laatu on ensiarvoisen tärkeää.

2 tykkäystä

Niin vaikka CNN:n lopussa oleva Fully connected pystyy konvoluutiokerroksien löytämien featurien perusteella antamaan todennäköisyyden mitä kuva esittää. Haaste lienee, että objektien tunnistus on helppoa mutta usein kokonaisuuteen vaikuttaa konteksti jossa objekti on ja pitäisi lisäksi päättää mitä tehdään. Kaikkeen päätöksen tekoon vaikuttaa datan laatu

Mobileyen Prof. Amnon Shashua on kertonut, että toiminnan rakentaminen pelkästään looppiin jossa kamerat tunnistavat poikkeustilanteen joilla opetetaan neuroverkko ja joiden tiedoilla päivitetään autojen neuroverkko on brutaali tapa yrittää saada älyttömällä määrällä yksipuolista dataa neuroverkot oppimaan

Keskeistä on tunnistaa mitä on ratkaistava ja saatava mahdollisimman laajasti erilaista dataa koko ratkaistavasta tilanteesta. Yhtenä monipuolisen datan tuottajana on automaattisesti luotava AV-map.
Tietyssä mielessä tässä ratkaisussa data on laadukkaampaa kuin mainitussa poikkeustilanteiden kautta etenevässä Teslan mallissa, jossa pelataan isolla datamäärällä.

Itse olen kirjoittanut pilven datan käytöstä jo ennen kuin huomasin Mobileye:n muuttaneen puhtaan kamera+NN ratkaisun laajemman datan tarjoavan AV-kartta + lidar + sw-tarkennettu radar + kamera malliin

Tätä samaa Mobileyen mallia käyttävät suuri osa toimijoista vaikka eivät sitä suoraan kerro.

4 tykkäystä

Radarissa on sellaisia ominaisuuksia joita mikään kamera ei ikinä pysty saavuttamaan ja ei ole kuin muutama vuosi siitä kun Musk itse hehkutti samaa.

Mutta mielenkiintoista on se että Musk yksitellen tiputtaa sensoreita paketista, sensor fusion oli kova juttu tähän asti ja vielä puoli vuotta sitten Tesla oli tuomassa uutta tutkaa mukaan.

En usko että pelkät kamerat tulevat riittämään mutta we’ll see.

Edit vahva signaali? Aika moni voisi sanoa täysin päinvastaista eikä kukaan ole pystynyt selittämään järkevästi miksi radaria ei olisi voinut jättää mukaan palettiin, tähän asti pätevin selitys on se että Teslan 3.0 hardiskaan ei riitä käsittelemään datamääriä joten tutka tiputetaan pois.

6 tykkäystä

Niin on kahvinkeittimessäkin. Tarvitaanko sitä self drivingiin on epäselvää.

Tämä on nimenomaan mielenkiintoista myös minusta. Selvää on että Teslan usko kameran riittävyyteen kasvaa, ei laske.

3 tykkäystä

Kaikki johtavat autonomous drvingia kehittävät tahot pitävät tutkan ja lidarin tarvetta selviönä.

Tuo se ydinongelma on. Kuvadatan analysointi on kuvan tulkintaa (image interpretation), joka tapahtuu tietyssä kontekstissä. Esimerkiksi näin on mm. aikaisemmassa viestissä mainitsemassani radiologiassa, jossa radiologi tulkitsee kuvadataa potilaan muiden tietojen (potilaan historia, labratulokset, toimenpiteet, vierasesineet, lääkitys jne) luomassa kontekstissa. Potilaan tilasta ja historiasta riippuen “oikea” tulkinta kuvasta voi vaihdella hyvinkin paljon.
Jos konteksti on kovin suppea tai puuttuu kokonaan, kasvaa virheellisten tulkintojen määrä. Jos Tesla käyttää vain kameroita, on heidän järjestelmän käytössä oleva konteksti väkisin suppeampi kuin useampia sensorityyppejä käyttävien.

5 tykkäystä

Kun koko asiaa ajattelee hyvin objektiivisesti, niin onko FSDssä oikeasti sellaista early mover advantage, jossa ensimmäinen onnistuja veisi jotenkin merkittävästi potin. Vaikka jollain toimijalla olisi toimiva ratkaisu, niin sen skaalauttaminen ja hyväksyttäminen vie huomattavasti aikaa. Alustatalouteen paradoksiaalisesti liittyy sekä ensimmäisen etuja, että sen seuraajan etuja.

Itsellä on jonkinlainen altistuminen näihin bisnesmalleihin liittyvälle tieteelle ja hieman minua epäilyttää, että tuleeko automatisoiduista autoista mitään erityistä “winner takes it all”-bisnestä. Taustalla myös voi piillä jonkinlainen industry standard- mörkö, jolloin näitä ratkaisuja ei saada suljettua täysin patenteilla.

Vähän jokaiselle jotain: Tesla-bulli lukee viestin ja ajattelee, ettei sillä ole oikeasti niin väliä vaikka FSD-myöhästyisi muutamalla vuodella, koska se Teslan kassavirtoihin huippu on povattu sinne vuoteen 2030, joka painaa arvostuksen vaassa niin hurjasti, ettei oikeastaan tämän tai seuraavan vuoden tuloksella ole mitään väliä. Tesla-bearille taas näkyvyys toisi sellaisen onnen, ettei se vuosien 2026-2030 softapuolen tulovirta ole millään tavalla taattua Teslalle, vaikka saisivat autoja pihalle ok tahtiin.

Jos minulta kysyttäisiin, mikä ei välttämättä ole kannattavaa, että mikä on automatisoidun ajon lähitulevaisuus (seuraavat 10v), niin se on sille rajatut omat alueet, missä se on käytössä. On hieman vaikeaa sanoa, että miten tälläinen kirjekuori-malli vaikuttaa bisnekseen, mutta ei välttämättä ainakaan täysin positiivisesti

2 tykkäystä

Kukahan näitä enää ostaa tähän hintaan, kevyt 50 % korotus solar roofin hintaan. Varmaan aikaisemmat asiakkaat myös mielissään, kun odottaneet tilausta pari vuotta ja nyt tämä.

3 tykkäystä

@JukkaM Erittäin hyvää kommentointia AI:sta/neuroverkoista. Näkee, että olet riittävän syvällä tämän teknologian ymmärtämisessä. Kuten kommentoit, on yleistä, että sovelluskehittäjä on hyvin kapeakatseinen ja monesti lukittuu siihen omaan yhteen ratkaisumalliin liian pitkälle eikä osaa luovuttaa.

Näistä sinun kommentoijista näkee hyvin tämän ja toistaalta pistää jopa miettimään, onko heillä oikeasti asiasta käytännön kokemusta. Tämä on niin monimutkainen kokonaisuus, että minusta koko sähköautokehitys on Teslan osalta edennyt takapuoli edellä. Olisi ollut paljon järkevämpää ottaa asiaan FSD:n osalta puhdas “betakehityspolku”, jossa haetaan erilaisilla ratkaisumalleilla pikku hiljaa sitä lopullista polkua, koska on aivan päivänselvää, ettei 5-level ole seuraavan 10 vuoden aikana ratkaistu. Mitä pidemmälle kehityspolussa mennään, sitä enemmän mukaan alkaa tulla mukaan yhteiskunnan säädöksiä ja vaatimuksia toimivuudesta. Jokainen, joka on ollut pitkään sovelluskehityksessä tietää, että isojen järjestelmien lopulliseen muotoon saattaminen kestää ensimmäisten versioiden jälkeen todella pitkään. Monet bugit tulee esille yllättävien tilanteiden yhteydessä, joita ei ole mikään testirobotti pystynyt löytämään. Saati sitten tällaisen FSD:n osalta.

Jo pelkästään sähköautoteknologian ADAS:ien avulla saaminen laadukkaiksi ja kestäviksi on iso kehitysaskel, latausinfran kanssa. Autojen luotettavuudestahan alkaa vasta pikku hiljaa tulemaan tuloksia ulos. Mikäli Tesla olisi lähtenyt pienemmällä FSD-rummutuksella liikkeelle ja uskottavammalla kehityssuunnitelmalla, yhtiön kurssi olisi paljon vakaammalla tasolla ja tuskin yhtään sen alhaisempana. AV-map tulee käyttöön, se ratkaisee niin monta muutakin asiaa, kuten Jukka olet kuvannut.

13 tykkäystä

Voyagen CEO nostaa esiin palstan keskusteluissa esiin tulleet samat kaksi asiaa Teslan FSD:stä, joilla se poikkeaa muista:

  • ei HD karttoja
  • ei lidaria (eikä enää edes radaria)

Tesla on tehnyt alun perinkin vaikeasta asiasta vieläkin vaikeamman. Tai kuten Tesla bull sanoisi, Tesla ei mene sieltä mistä aita on matalin, vaan tavoittelee kerralla todellista kaikkialla toimivaa L5 ratkaisua.

FSD has taken a complex problem and made it more complex, with no pre-recorded HD map and reduced sensor modalities. Their data advantage helps, but given this starting point, it is unclear if it is meaningful.

2 tykkäystä

Olen toistanut itseäni kommentoimalla liikenneinfran tarpeellisuutta. Tulevaisuudessa autojen ei tarvitse nähdä liikennevaloja tai nopeusrajoituksia, vaan tieto niistä tulee muuta kautta auton käsiteltäväksi. Tulevaisuudessa myös yllättäviä tilanteita voidaan vähentää, rajaamalla eri toimijoille selkeämmin omat alueensa. Autoille kerrotaan että tuo alue on on polkupyörille, sinne ei saa mennä jne. Ns. mahdoton tehtävä yrittää autosta tutkien ja kameroiden avulla saada ihmisen veroista. Ihminen häviää monissa eloonjäämiseen liittyvissä nopeissa reagoinneissa ja kyvyissä apinallekin. Toisaalta kaupungissa apina jää helposti auton alle, kun ei tunne sääntöjä ja autot eivät ole varautuneet apinoihin.
Tämä vaatii lainsäädäntöä, ei Muskin tapaisia minä itse -ratkaisijoita.

5 tykkäystä

Tässä hyvä esimerkki liikenneinfrasta. Sensori syöttää pilveen reaaliaikaista tietoa, jota auto hyödyntää. 5G:n hyödyntämisestä voi tulla kolmas tekijä, joka erottaa Teslan kilpailijoista. Jos Tesla todella alkaa käyttää Starlink-verkkoa kommunikointiin, ei sen latenssiaika riitä edge-computingiin, väittäisin.

Otin kuvan suomalaisen autonomous driving yrityksen Sensible4:n nettisivuilta.
Heiltä on vuoden lopussa tulossa Hervantaan autonominen pikkubussi syöttämään raitiovaunuliikennettä

1 tykkäys

Tuossakin kuvassa kameran näköinen laite yrittää tunnistaa ihmisen. Ihmisellä voisi olla mukana kännykkä tai joku muu laite, jolla itse kertoo sijaintinsa - kuin suunnistuskisoissa. Maalikameraa tarvitaan vasta sitten, kun auto on ajanut yli. Mutta miksi auton ylipäätään pitäisi tietää nurkan takana jalkakäytävällä olevasta ihmisestä. Onko oletus, että sieltä tulee se em. apina. Näillä tapauksilla laitetaan infralle vaatimuksia, joita ajamisella nyt ei ole. Kyse ei kuitenkaan ole mistään sotapelistä.

En pidä itseäni minkäänlaisena neuroverkkoasiantuntijana, mutta luen eri toimijoiden varsinaisten asiantuntijoiden tekstejä ja teen johtopäätöksiä niiden mukaan.

Itse uskon myös, että autonomisuus kehittyy normaaliin liikenteeseen ADAS-toiminnallisuuksien sekä autonomisuutta tukevat tieliikenneinfran (AV-kartta, tiedonsiirrot…) vuosi vuodelta. Samalla säädöksiä kehitetään.
Samaan aikaan tason 5 Robotaxit yleistyvät rajatuilla alueilla. Nämä kummatkin kehityspolut tukevat toistensa kehitystä ja pitkän ajan kuluessa yhdistyvät

Tuo @MiamiFan linkkaaman Sensible4 lähestyminen tukee yleistä kehitystä ja mm. Kiinassa käytetään jo tuotantotesteissä lidaria/kameraa välittämään vaikeista risteyksistä objekteja (kävelijät…) pilveen, joten mm. autot saavat neuroverkolleen tiedon etukäteen.

Epäilemäni Teslan suppean datan ongelma on neuroverkon yleinen underfitting ongelma.

Koska poikkeustilanteita on periaatteessa ääretön määrä, Teslan neuroverkot ovat tilanteessa, jossa pienet sisääntulon muutokset tarkoittavat eri asiaa lähdöissä.
Asiaa voi havainnollistaa kuvantunnistamisella. Jos neuroverkolle näytettäisiin samalta emolta samaan aikaan syntyneitä koiria, jotka näyttävät täysin samoilta. Eroja ei ihminen erottaisi. Hyvin pienet sisääntulon (kuvan) muutokset tarkoittavat eri koiraa.
Teslalla tämä tilanne voisi siis olla eri toiminnallisuuksien neuroverkoissa.

Yksi ratkaisu olisi lisätä neuroverkon monimutkaisuutta eli lisätään kerroksia ja/tai neuroneja. Tällöin kyetään lukemaan pienempien sisääntulojen erojen vaikutuksia lähtöihin, mutta tämän seurauksena neuroverkon opetus vaatii enemmän aikaa/tehoja

Eli ajan saatossa Tesla lähestyy hitaammin ja hitaammin tavoitetta, koska sen neuroverkon oppiminen hidastuu ja sen kouluttaminen vaatii enemmän aikaa/tehoja

Toinen ratkaisu underfitting ongelmaan on lisätä sisääntuloon ongelman ratkaisua tukevaa uudenlaista dataa, data voi pohjautua AV-karttaan, lidariin jne.
Tällöin neuroverkko kykenee pienemmällä koulutusdatan määrällä sekä yksinkertaisemmalla rakenteella oppimaan saman asian.

Luulisin, että tämä on yksi syy sen taustalla, että Mobileye siirtyi kamera+neuroverkosta laajempaan dataan
Jos Tesla onnistuu omassa ratkaisussaan, näyttävät tällaiset kommentit toki naurettavilta

5 tykkäystä

HD-mapit ja liikenneinfra yksinkertaistavat ongelmaa. Niiden hyödyntämisen tie on inkrementaalinen, tiukasti lainsäädännön ja standardoinnin kanssa yhdessä etenevä. Tätä reittiä etenevät firmat tulevat julkaisemaan rajatuilla reiteillä toimivia automous-ratkaisuja (Hervannan raitiovaunu-feeder bussi, Norjan ski-bussit, Arizonan Waymo-taksit)

Tesla on päättänyt hypätä nämä vaiheet yli. Ovat joko todella luottavaisia omiin kykyihinsä, tai sitten tavoitteena onkin vain todella hyvä L2 systeemi, jolla saa hyvin tulovirtaa ja aina voi pitää yllä lupausta nurkan takana odottavasta L5:stä.

L2:sta on kuitenkin iso hyppäys pelkästään L3:een, koska vastuu myös korvausmielessä siirtyy Teslalle, ja monissa valtioissa myös vaaditaan viranomaislupia.

2 tykkäystä

Tämä vanheni hienosti.

Tesla Gains on Canaccord Upgrade Citing Apple-Like Energy Ecosystem

https://www.thestreet.com/investing/tesla-gains-on-canaccord-boost-citing-apple-like-energy-ecosystem

3 tykkäystä