Eduskuntavaalit 2023

Onneksi noin ei tehdä. Tilastotiedettä ymmärtämätön kansanosa saattaisi luulla, että se kannatus on yhtä todenäköisesti mitä tahansa tuolla välillä. Parempi kertoa se saatu todennäköisin tulos kuten tehdäänkin. Ja lisäksi hyvä kertoa virhemarginaalikin. Toki sen voisi laskea joka puolueelle erikseen kun se on kaikilla eri.

En myös itse tunnista piirrettä, että noin pienet galluperot vaikuttaisivat millään tavalla siihen, minkä puolueen valitsen uurnilla. En myös tunne ketään, joka niin tekisi. Mutta ehkä joku tekee, mene ja tiedä.

Ei, vaan luultavasti SDP:n kannatus on suurempi kuin PS:n ja KOK:n. SDP:n kannatus on todennäköisemmin 20,4% kuin PS:n tai KOK:n kannatus tuossa esimerkissä.

Yhdessäkään vaalitentissä ei koskaan anneta kaikkia puheenvuoroja gallupien mukaisessa järjestyksessä, joten tuo on aika keinotekoinen skenaario. Gallupeja ei myöskään julkaista juuri ennen vaaleja.

Olen 100%:isen varma, että jatkossakin galluptulokset kerrotaan 0,1%-yks tarkkuudella ja virhemarginaalit kerrotaan kuten nyt. Meidän tehtävämme on tajuta luvut ja opastaa niitä, jotka eivät tajua.

5 tykkäystä

Noista gallupeista. Matemaatikko Samuli Siltanen kertoi niiden olevan tarkkoja ja havainnoi sitä hyvällä esimerkillä nopan silmälukujen keskiarvolla(3,5). Jos heität noppaa 10 kertaa, voi keskiarvo olla mitä vain. Jos heität 100 kertaa, alkaa keskiarvo olla jo lähellä tuota 3,5. Kun heität 1000 kertaa, on se aina 3,5. Eli kun 2000 kysyt mielipidettä niin kyllä se osuu oikein. Gallupin ja vaalituloksen ero tietty siinä et ihmiset ei vastaa rehellisesti aina ja viimeisen gallupin ja vaalipäivän välissä myös monen mieli muuttuu. Tutkimusasetelma voi toki olla myös vinoutunut.

9 tykkäystä

Ok, eli ei muuta kuin satunnaiskohinan kuvaamista. Siis se vaikutelma, että kilpailevat gallupit kuvastavat toisistaan riippumatta verraten hyvin sitä muutoksen suuntaa silloin kun kuvaavat samaa ajanjaksoa ei vielä tarkoita, että ne kuvaisivat muutostrendiä yhtään paremmin kuin virhemarginaali antaa ymmärtää.

(Se, että osa gallupin vastaajista muodostuu pysyvästä kyselypaneelista, vaikuttanee siihen suuntaan, että muutoksen suunta ja suuruus tulee silti ilmi tarkempana kuin puolueiden varsinainen kannatustaso.)

1 tykkäys

Koska tälläisen gallupin tekemisessä kestää usein viikkoja. Esim tuo uusin on tehtiin 9.1-31.1 välillä ja otoskoot on melko pieniä joten 95% luottamusvälillä virhemarginaali on 2%. Paljon rehelisempää olisi koostaa noin lähekkäisten galluppien data yhteen ja pienentää virhettä mutta lehdet haluavat repiä otsikoita kohinasta koska se myy.

Myönnän että nykyinen Kokoomuksen lasku on todennäköisesti todellista koska se on jatkunut jo muutaman gallupin ajan ja siinä näyttäisi olevan trendiä.
Kahdesta mitta pisteestä muutoksen laskeminen on haasteellsta koska molemmissa mittauksissa on virhettä ja täten virheet kumuloituvat mutta toisaalta jakauman muoto on jyrkempi painottaen pienempiä virheitä. Esimerkiksi kärkipuolue voisi saada kahden eri mittauksen välillä yli 4% muutoksen joka johtuukin vain molempien mittauksien kohinasta. Tälläisen todennäköisyys on 5% * 0.5 * 5% = 0.125%. Otsikkona olisi kuitenkin megajytky!

Tässä jää myös kaikki systemaattiset virheet huomioimatta joita kyllä yritetään minimoida ja kompensoida.
Huonona esimerkkinä vaikka gallupin tekeminen osuu hiihtolomaviikolle ja lapsiperheet ovatkin kiireiden takia aliedustettuna.

Edit: Laskukaava antaa hieman konservatiivisen todennäköisyyden ja itseasiassa laskee tilanteen missä ensimmäinen mittaus tulos heittää yli virhemarginaalin verran ja toinen mittaus myöskin mutta päinvastaiseen suuntaan. Pelkkä yli kahden virhemarginaalin erotus on tätä todennäköisyyttä hieman suurempi mutta ei päässälaskettava kaava.

1 tykkäys

Mielestäni gallupeiden tehtävänä on kertoa missä kannatukset niiden mukaan menevät, antaen samalla tavallisille ja heikomminkin koulutetuille ihmisille mahdollisimman realistinen ja mahdollisuuksien mukaan helppotajuinen kuva arvioiden tarkkuudesta.

Nykyisellään annetaan tarkka luku, joka aika epätodennäköisesti olisi puolueen todellinen kannatus jos vaalit järjestettäisiin nyt. Normaalijakauma sen ympärillä, ja suikale kokoomuksen kannatuksen välillä 21,55-21,65% on ohut. Tarkka 21,6% jää kuitenkin ihmisille päällimmäisenä mieleen. Virhemarginaali mainitaan, mutta monien on hankalaa alkaa analysoida mitä siitä voi päätellä. Monille vaikea ja joillekin ehkä luotaantyötävä tilastollinen termi.

Jos gallupista kerrottaisiin päällimmäisenä että kok 20-23%, painottuen välin keskiosaan, väittäisin että useimmat pystyisivät hahmottamaan tämän. Siinähän on kattavasti ja helposti ymmärrettävästi gallupin keskeisin sisältö. Pienemmällä voisi lukea kaikki tilastolliset speksit, en tietenkään ole niitä sensuroimassa. Ehkä vältyttäisiin sellaisilta otsikoilta kuin ”Keskusta romahti jo vihreidenkin taakse” :laughing:

Siis sama filosofia kuin sääennustuksissa. Niihinhän sisältyy hyvin monimutkaista fysiikkaa, tilastotiedettä jne, mutta meteorologin tehtävä on kaikesta tästä suodattaa ymmärrettävä, kuitenkin keskeiset päätelmät sisältävä paketti kansalaisille.

PS. Noita istumajärjestyksiä on kyllä viimeisellä viikolla ollut. Muistan kun Lipponen oli 2012 pressanvaaleissa vajonnut siinä vaiheessa gallupissa kuudenneksi (en enää muista oliko tiistain Hesari&Nelonen vai keskiviikon Maikkari), ja oli hirveän tuohtunut istumajärjestyksestä.

2 tykkäystä

Mahtaisikohan Lundmark ottaa töihin kaikki nämä tuhannet työttömät somalit, afgaanit sekä irakilaiset, joiden maahan ottamista perussuomalaiset kovin vastustavat ja josta Lundmark ja samalla Versterbackakin heitä ääneen moittivat:

Miten voi olla että esitetään Suomen tarvitsevan lisää maahanmuuttoa, mutta meillä on silti enemmistö maahan jo saapuneista kolmannen maan maahanmuuttajista edelleen vailla töitä? Onko ajatus se, että seuraavat irakilaiset työllistyvät paljon aiemmin tulleita paremmin vai mikä tässä on se logiikka? Jos on kova työvoimapula, niin miksi ei oteta töihin esim. noita työttömiä 60% irakilaisia?

Nythän on ihan ilmiselvää, että suomen julkinen talous on sitä heikommassa kunnossa mitä enemmän näitä kehitysmaiden kansoja tänne saapuu. 40% työllisyysasteella yhtälö on rajusti miinusmerkkinen.

Perussuomalaiset esittävät, että sosiaaliturvan perässä saapuva maahanmuutto pitäisi lopettaa (ei siten koske esim. EU:n sisällä taikka USA:sta saapuvaa muuttoliikettä). Miten he ovat asiassa väärässä, jos asiaa kansantaloutemme näkökulmasta tarkastellaan?

Miksei Lundmark sano ääneen, ettei heilläkään ole käyttöä lukutaidottomalle 35 vuotiaalle ihmiselle. Suomeen on tullut suuri määrä aivan täysin vääränlaista maahanmuuttoa, joka pitäisi saada taloutemme pelastamisen näkökulmasta nopeasti pysäytettyä.

23 tykkäystä

Laskin sitten laskimella mikä on todennäköisyys että tuo 0.1% välillä annettu kannatus on oikein ja se on vain ~4% tapauksia oikea.
Jos tulokset annettaisiin edes prosentin tarkkuudella niin ne olisi oikein kuitenkin vain ~38% varmuudella kärkipuolueella. Oletetus 2% virhemarginaalista.
Kun meillä on kolme kärkipuoluetta niin käytännössä jokaisessa gallupissa ei päästä edes oikealla prosentille kaikille kolmelle. 0.62^3= ~5%.
Ja silti nämä esitetään 0.1% tarkkuudella ja kaikki muutokset otsikoidaan ilman minkäänlaista epävarmuutta.

Ja kaikille muille vastaaville virhemarginaalin sisällä oleville tuloksille todennäköisyys on tätä pienempi. Laskepa todennäköisyys siellä merginaalin reunoilla, tai sen ulkopuolella. Kaikki lukemat ovat mahdollisia. Ilmoitettu on se todennäköisin.

Ylen otsikko: “Kolmen isoimman kisa kiristyy – kokoomus laski, SDP kiri kakkoseksi PS:n ohi”. Ei annettu mitään prosentteja, kerrottiin muutosten pääkohdat ja trendit. Kiinnostuneet voivat sitten katsella tuloksia ja ne ilmoitetaan kuten tilastotieteessä tehdään. Vaikka se kuinka harmittaa kun oma lempparipuolue ei menestykään niin hyvin kuin toivoisi.

4 tykkäystä

Mutta ei ole oikein 96% tapauksia. Miksi esittää tarkuudella mihin ei ole minkäänlaista varmuutta?

Luottamusväli pitäisi nostaa 1.35% yksikköön jotta on 50% todennäköisyys osua oikeaan. Iso väli ja silti sen todenmukaisuudesta ottamatta edes huomioon systemaattisia virheitä on iso epäilys.

Edit:

Jos viittasit tällä minuun niin en ole minkään puolueen äänestäjä ollut 20 vuoteen. Seuraan politiikkaa aktiivisesti mutta en Suomesta löydä äänestämisen arvoista puoluetta. Joten ei ole lempipuolueita tai biaksia.

Koska se kuvaa gallupin tulosta parhaiten. Se jakauma on symmetrinen kummallekin pouolelle saatua tulosta. Tuo on se keskiarvo sille jakaumalle. Oikea tulos voi olla suurempi tai pienempi, mutta tuo on ainoa yksittäinen tunnusluku, joka gallupista kannattaa kertoa. Tuo yhdessä virhemarginaalin kanssa kertoo jo todella paljon kannatuksesta.

Mediaa voit toki syyttää siitä, ettei se joka gallupin yhteydessä opeta tulosten merkitystä. Mutta en mä käsitä lainkaan tuota itkua siitä, että gallupin tulokset ilmoitetaan juuri niin kuin ne tilastotieteessä ilmoitetaan. Jos sulle henkilökohtaisesti tuottaa tuskaa sen tuloksen kertominen, niin hyppää sitten luvut yli ja tuijota vaan sitä marginaalia. Sama kai se.

5 tykkäystä

Kannatusarvio on laskennallinen tulos näihin kysymyksiin saaduista vastauksista.
“Äänestin eduskuntavaaleissa” ja ”äänestin kuntavaaleissa” -tulosta verrataan vastaavien vaalien todelliseen tulokseen. Kullekin puolueelle
lasketaan korjauskerroin, jolla viime vaaleissa äänestäneiden tulos oikaistaan vaalitulosta vastaavaksi. Näillä kertoimilla korjataan samojen
vastaajien “äänestäisin nyt” -tulos. Tällä menetelmällä ”uudet äänet” (ei äänestänyt ekv 2019, kv 2021), kertoi puoluekantansa nyt) lisätään
puolueiden kannatukseen pienentävällä painokertoimella. Tämä kerroin ei ole puoluekohtainen, vaan kaikille puolueille sama.
Kannatusarvion virhemarginaalit ovat 95 prosentin luottamustasolla suurimpien puolueiden osalta ilmoitetaan kunkin jakson yhteydessä.
Korjauskertoimien ansiosta tulos on kuitenkin käytännössä tarkempi kuin pelkkä tilastollinen virhemarginaali osoittaa.

Lähdemateriaali löytyy @jokuvaan1 viestistä. Tarkemmin ei ole Taloustutkimus avannut “korjauskertoimien” laskentatapaansa. Korjauskertoimilla yleensä “sopivasti” korjaillaan mittaustuloksia. Tiedä sitten mihinkä suuntaan niitä kukin taho korjailee? :thinking:

Näin mittaamisen parissa päivittäin työskentelevänä saa kulmakarvoja yleensä nostella kun korjauskerrointa tarjoillaan käytettäväksi.

4 tykkäystä

Tilastotiede ei kyllä mitenkään sanele että tulokset pitää esittää promillen tarkkuudella, ilmoittaa virhemarginaali pienellä präntillä ja tehdä tuloksista johtopäätöksiä ilman minkäänlaista merkkiä epävarmuudesta. Kritiikkini kohdistuu vain ja ainostaan tähän median luomaan gallup kulttuuriin.

Voitaisiko puhua vain asiasta ja jättää tälläiset henkilöön menevät ”itkut” ja ”tuskat” tekstistä pois.

3 tykkäystä

@Paapaa Jos kerron että minulla on tässä normaalijakauma jonka odotusarvo on 51,365, et varmaan ole tällä tiedolla ihan riittävästi perillä jakauman luonteesta? Tiedät keskikohdan aika tarkastikin, mutta sinulla ei ole mitään käsitystä, miten suhtautua siihen. Ehkä todennäköisyysmassa on keskittynyt tiiviisti sen ympärille, tai ehkä jakauma on tosi levällään? Jos hallitset asiaa, tietämällä lisäksi varianssin pääset perille jakaumasta.

Ongelmana suurelle yleisölle kommunikoinnissa on, että tällaiset käsitteet eivät ole laajasti hallussa, kuten ei virhemarginaalikaan. Jos jakauman luonne on uutisarvoinen asia, se olisi hyvä kommunikoida ihmisille napakan ymmärrettävästi. Nykyisin siis kerrotaan hyvin tarkasti odotusarvo, joka vie kaiken huomion. Tarkkuus antaa ihmisille kuvan, että tähän yhteen lukuun voi suhtautua suurella luottamuksella. Hyvää kokonaiskuvaa jakaumasta, eli vaikka gallupin antamasta näkemyksestä persujen kannatukseen, ei välity.

Yhteiskunnassa kaikki on muutoksessa. Vaikka kuinka ajattelisi että joissakin uutisoinneissa ”näin on aina ollut ja tulee aina olemaankin”, tyyli muuttuu ajassa. Ennen 2008 presidentinvaalien esivaaleja USA:n vaaliuutisoinneissa ei juurikaan puhuttu todennäköisyyksistä. Nate Silver toi tämän silloin, ja 2012 se oli jo valtavirtaa. Säälähetykset ovat nyt erilaisia kuin vaikka 20 vuotta sitten; nykyään ihmisille ainakin omien mielikuvieni mukaan avataan ilmiöitä enemmän. Asian pedagogista puolta on varmasti mietitty paljon.

Kuka tietää vaikka gallupeistakin viestittäisiin joskus tulevaisuudessa hieman eri tavalla kuin nyt? Tähän pohdin avoimin mielin uusia lähestymistapoja, kuten painotettuja välejä. En itkenyt enkä tuntenut tuskaa lemppareiden puolesta. Kun sinulla on eri näkemyksiä, voit esittää ne neutraalin fiksusti. Erilaisten ajatusten vaihto on silloin parhaimmillaan hyvinkin antoisaa.

6 tykkäystä

Ok, olen asiasta eri mieltä. YLE/Taloustutkimus esimerkiksi kertoo tuoreimmassa gallupartikkelissaan virhemarginaalin kahteen kertaan, sekä tulokset esittävän kuvaajan yhteydessä, että uudestaan gallupin tiedot esittelevässä infolaatikossa. Jutussa erikseen korostetaan tulosten lähekkäisyyttä esim. näin:

Kaikkien kolmen puolueen kannatus mahtuu runsaan kolmen prosenttiyksikön kehikkoon.

Otsikossa ei mainita prosentin kymmenyksiä mitenkään, vaan kerrotaan yleisemmin, että:

Kolmen isoimman kisa kiristyy

Vaikea keksiä, miten tuossa nyt äänestäjää harhautetaan millään tavalla tai jätetään oleellista kertomatta.

Niin, kuten yllä totesin, gallupeissa kerrotaan virhemarginaali jopa useaan kertaan yhden artikkelin sisällä. Ja se on lähes aina mukana myös kuvaajassa, jota suurin osa ihmisistä tuijottaa.

Lisäksi, se virhemarginaali ei edes heittelehdi mitenkään valtavasti. Otokset ovat yleensä 1000-2000 maastossa, joten sekään ei tule joka kuukausi kauhean suurena yllätyksenä kenellekään.

Mutta joo, en pane pahakseni jos tämä opetettaisiin koulussa, sillä vaikeaa tuntuu olevan niin monelle. Varsinkin virhemarginaalin merkityksen ymmärtäminen.

4 tykkäystä

Tämä oli täysin asiallinen vastaus joten hyvä kohta lopettaa ainakin omalta osaltani :+1:

Kahvihuoneessa on muuten ihan aiheellinen valitus, että tästä asiasta on jauhettu liikaa. Pitäisi siirtyä pohtimaan taas vaalien asetelmia.

6 tykkäystä

Sinänsä on mielenkiintoista, että tämä viimeisin Ylen mittaus laukaisi keskustelun gallupeista ja niiden luotettavuudesta. Onhan nimittäin aina mahdollista, että juuri tämä otos ei onnistunut kuvaamaan puolueiden todellista kannatusta luotettavalla tavalla. Tähän voisi viitata se, että kyselyn mukaan sekä Persut, että Kokoomus menettivät kannatusta ja tämä ei ehkä aivan ole kaikkien odotusten mukaista. Toisaalta mielestäni on aina lähtökohtaisesti hyväksyttävä tietty epävarmuus ja uskon, että tällä palstalla ymmärretään tämä, onhan suurin osa meistä tottunut siihen jo sijoittaessaan osakkeisiin. On myös hyväksyttävä se, että todellisuus voi yllättää ja silloin on mietittävä omien ennustusten oletukset uusiksi. Välillä omat toiveet muuttuvat ennustuksiksi. Veikkaan rohkeasti, että palstalaisille tämä viimeisin gallup oli epämiellyttävä yllätys ja näitä tuloksia ei oikein haluta uskoa todeksi. Viittaan aiemmin esittämääni kognitiiviseen harhaan. En halua tässä provosoida ketään, esitän tämän yhtenä hypoteesina ja voin olla asiassa täysin väärässä.

Oma teoriani tuloksista on että Liberaalit saivat uutta kannatusta paljon uutisoidulla leikkuslistallaan. Nämä äänestäjät olisivat perinteisiä Kokoomuksen kannattajia. Tuo muiden puolueiden muutos 1.6% → 2.7% selittyisi tällä.

Se että tästä tuli keskustelua johtui siitä että nähtävästi sohaisin ampiaispesään kun tokaisin että kaikki muutokset ovat virhemarginaalin sisällä.(tarkennuksena: isojen puolueisen osalta).
Tämä ilmeisesti tulkittiin väärin että se sisältäisi jonkinlaisen kannanoton gallup muutokseen vaikka kritiikki on vain yleistä gallup uutisointia kohtaan eikä millään muotoa tämän otoksen tulosta.

2 tykkäystä

Uskon, että olet oikeilla jäljillä analyysissäsi.

1 tykkäys

Varmasti näin ja ei voi kun ihmetellä miksi näin. Tässä voi käydä vuoden 2019 toisinto jolloin Hjallis lähtiessään kokoomuksesta mahdollisti demarien vaalivoiton. Mitä iloa liberaalien äänestämisessä jos lopputuloksena demarit suurin puolue? Sanna Kurronen painaa oppositiossa nappia neljä vuotta ja Marinin johdolla velkavuori vain kasvaa ja pysähtyneisyyden aika jatkuu.

5 tykkäystä

Olisihan tässä sellainen iso ilo että Liberaalipuolue saisi edustajapaikan myötä ison statuksen kohotuksen, jolloin kiinnostus seuraavissa vaaleissa kasvaa kun ei enää ajatella niin vahvasti ettei sieltä kukaan kuitenkaan pääse.

6 tykkäystä