Mikä on todennäköisyys, että lottokierroksella on enemmän 7 kuin 6 oikein -rivejä?

Mikä on todennäköisyys, että lottokierroksella on enemmän 7 kuin 6 oikein -rivejä?

Tiedustelin aikanaan matematiikan opettajaltakin tätä, mutta en saanut vastausta silloin ja asia jäi vaivaamaan. Eli siis, mikä on todennäköisyys sille sattumalle, että yksittäisellä lottokierroksella olisi enemmän sellaisia rivejä, joissa on kaikki 7 numeroa oikein kuin niitä rivejä, joissa on "vain" 6 oikein? Ymmärrän, että jokaisessa 7 oikein rivissä on myös 6 numeroa oikein, mutta tarkoitan nimenomaan sitä tilannetta, jossa huomioidaan vain puhtaasti joko 7 oikein tai 6 oikein -tulokset, aivan kuten lottoarvonnan jälkeenkin ilmaistaan kappalemäärä 7 oikein veikanneille ja kappalemäärä 6 oikein veikanneille.

2 vastausta
80

Kysymys on luonteeltaan tilastollinen: jotta sen voisi laskea, pitäisi tietää, millaisia rivejä pelaajat ovat pelanneet. Veikkauksella tietysti tällainen tilastotieto on, mutta julkisesti siitä on vain joitakin yksittäisiä tietoja. Jos kysyttäisiin sitä, millaiset rivit koneen arpomina ovat todennäköisiä, sen voisi laskea puhtaasti todennäköisyyslaskennan matemaattisin keinoin. Lottokone toimii eri tavalla kuin lottoa pelaavat ihmiset.

Julkisesti tiedetään esim. että riviä (1,2,3,4,5,6,7) pelataan hyvin paljon, noin 3000 kappaletta viikossa:
http://www.iltasanomat.fi/kotimaa/art-1288338420845.html

Jos kone sattuu arpomaan tämän rivin, tulee noin 3000 kappaletta 7 oikein, mutta 6 oikein -tuloksia ehkä vähemmän: tämä riippuu siitä, moniko on pelannut esim. rivin (1,2,3,4,5,6,10) tai (2,3,4,5,6,7,30) tai jonkun muun niistä riveistä, joissa on 6 numeroa väliltä 1-7.

On myös muita paljon pelattuja rivejä. Kun meillä ei niistä tarkkaa tietoa ole, emme voi laskea kysyttyä todennäköisyyttä. Jos olettaisimme että ihmiset valitsevat pelirivinsä satunnaisesti, sen voisi kyllä laskea (todennäköisyys olisi hyvin pieni) -- mutta tiedämme että näin ei ole.

Vielä yksi lähestymistapa kysymykseen olisi puhtaasti empiirinen: Katsotaan tähänastisista voittotilastoista, kuinka usein kysytty tapahtuma on toistunut. Tästä saataisiin karkea arvio tapahtuman todennäköisyydelle. Arvio on kuitenkin varsin karkea, koska lottoa on pelattu koko noin 40-vuotisen historiansa aikana reilut 2000 kierrosta. Jos tilastoista nähtäisiin (en ole tätä tarkistanut), että kysytty tapahtuma on tapahtunut tasan nolla kertaa, niin tietäisimme vain, että tapahtuma on ilmeisesti varsin harvinainen, mutta emme voisi nollatuloksesta päätellä, onko sen todennäköisyys esim. yksi miljoonasta, yksi miljardista, vai ehkä vielä vähemmän.

(Tohtorikoulutettava Jukka Kohonen)

Kommentit (1)
Sen varmaan voisi laskea, mikä olisi todennäköisyys tuolle kysytylle asialle, jos pelaa... Sen varmaan voisi laskea, mikä olisi todennäköisyys tuolle kysytylle asialle, jos pelaajat pelaisivat rivinsä yhtä sattumanvaraisesti, kuin kuin lottokone arpoo voittorivin.
31.12.2013 13:59 Matti Rantanen 4424
03.01.201414:10
70
69

Toki sen voi laskea. Jätetään vaikka yksinkertaisuuden vuoksi lisänumerot huomioimatta: tutkitaan monessako pelirivissä on 7 oikein ja monessako 6 varsinaista numeroa oikein.

Mahdollisia pelirivejä on M = 15380937 kappaletta. Lottokone arpoo näistä yhden voittoriviksi ("7 oikein"), ja tästä seuraa, että eräät 7*32 = 224 riviä ovat "6 oikein"-rivejä. Kysymys on siitä montako kertaa näitä on yhteensä pelattu.

Jos nyt pelaajat ovat valinneet esim. N = 10000000 riviä sattumanvaraisesti kaikkien M:n rivin joukosta, niin kutakin mahdollista riviä pelataan odotusarvoisesti N/M = noin 0,65 kertaa. Joitakin pelataan kerran, joitakin kaksi kertaa, joitakin ei yhtään jne. Kutakin yksittäistä riviä pelataan jokin satunnainen lukumäärä X, joka on binomijakautunut: X ~ Bin(N, 1/M).

Jos merkitään

X = montako kertaa on pelattu 7 oikein -riviä (ts. erästä yhtä riviä)

Y = montako kertaa on yhteensä pelattu 6 oikein -rivejä (ts. eräitä 224:ää riviä)

niin sattumanvaraisen pelaamisen oletuksen nojalla

X ~ Bin(N, 1/M)

Y ~ Bin(N, 224/M)

Tarkkaan ottaen X ja Y eivät ole riippumattomia, mutta ne ovat hyvin lähellä sitä, joten voidaan likimain laskea kuin ne olisivat riippumattomat. Kysytty todennäköisyys ("voittoriviä pelattu enemmän kuin 6 oikein -rivejä yhteensä) on nyt P(X > Y), ja se voidaan laskea osittamalla erillisiin tapahtumiin esim. näin:

P(X > Y) = P(X=1 ja Y<1) + P(X=2 ja Y<2) + P(X=3 ja Y<3) + ...

   = P(X=1) P(Y<1) + P(X=2) P(Y<2) + P(X=3) P(Y < 3) + ...

jossa esiintyvät termit ovat binomijakauman todennäköisyyksiä. Pienellä numeerisella harjoituksella saamme likimain

P(X > Y) = 2 * 10^(-133),

eli todella häviävän pieni todennäköisyys.

Mutta kuten alkuperäisessä vastauksessa totesin, tämä todennäköisyys ei alkuunkaan vastaa todellisuutta, sillä tosiasiassa loton pelaajat eivät valitse rivejään kuten laskussa oletettiin. Oletuksen mukaan olisi esim. äärimmäisen epätodennäköistä, että jotakin yksittäistä riviä pelattaisiinkin peräti 3000 kertaa tai enemmän. Kuitenkin tilastoista tiedämme, että tällaisia rivejä on viikoittain jopa useita (mm. rivit 1,2,3,4,5,6,7 ja 3,9,15,21,27,33,39).

Kommentit (0)

Vastauksesi