Regression monet kasvot

Veikkaajan kirous, huonon pelin jälkeen huutaminen ja epäonnistuneen ensimmäisen hypyn tuoma ”paineettomuus” vaikuttavat kaikki todellisilta ja toimivilta ilmiöiltä. Todellisuudessa niissä on kyse yhdestä ja samasta asiasta: paluusta keskiarvoon.
P1260466Jokin aika sitten törmäsin Twitterissä viestiin, jossa urheilutoimittaja manasi ”Veikkaajan kirousta”. Hän oli aiemmin tehnyt jutun hyvässä iskussa olevasta urheilijasta, jonka tulostaso oli hyytynyt kansijutun ilmestymisen jälkeen. Toimittaja harmitteli, että vaikka lehden nimi oli vaihtunut, kirous ei ollut lähtenyt minnekään.

Veikkaajan kirous ei ole mikään yksittäistapaus, vaan pikemminkin hyvin yleismaailmallinen. Yhdysvalloissa sama ilmiö tunnetaan ”Sports Illustrated -taikana”. Aivan kuten Veikkaajankin kohdalla, Yhdysvalloissa uskotaan, että SI:n kanteen päätyneen urheilijan seuraava kausi tai seuraavat arvokisat ovat tuomittuja epäonnistumaan. Ilmiön selitykseksi on tarjottu liiallista itseluottamusta ja suurten tavoitteiden saavuttamisen painetta.

Taloustieteen Nobelillakin palkittu psykologi Daniel Kahneman toteaa kirjassaan ”Thinking, Fast and Slow” selityksen olevan paljon yksinkertaisempi: ”Lehden kanteen yltäneen urheilijan suoritukset ovat väistämättä olleet poikkeuksellisen hyviä edeltävällä kaudella (tai viime aikoina), luultavasti melkoisen onnen saattelemia, ja onni on oikukas.”

Kahneman on luonut yksinkertaisen yhtälön menestykselle ja suurelle menestykselle: Menestys = taito + onni. Suuri menestys = hieman enemmän taitoa + paljon enemmän onnea

Kahneman havainnollistaa asian golfilla. Golf-kierroksen par on 72. Keskitymme nyt pelaajaan, joka menestyy ensimmäisenä päivänä erittäin hyvin ja saa tuloksen 66. Mitä voimme sanoa pelaajasta tuloksen perusteella? Välitön päätelmä on, että pelaaja on taitavampi kuin turnauksen keskimääräinen osanottaja. Menestyksen kaavan mukaan toinen päätelmä on yhtä oikeutettu: näin hyvin onnistuneella pelaajalla on luultavasti ollut myös keskimääräistä parempi onni.

Jos keskitymme myös pelaajaan, jonka tulos oli viisi yli parin, on syytä päätellä, että hän on melko huono JA että hänellä oli huono päivä. On myös täysin mahdollista, että tuloksen 77 saanut pelaaja on oikeastaan erittäin taitava, mutta hänellä oli poikkeuksellisen karmea päivä.

On erittäin todennäköistä, että näiden kahden pelaajan välinen ero pienenee toisena päivänä. Paras ennustettu tulos toiselle päivälle kummankin pelaajan kohdalla on lähempänä paria kuin ensimmäisenä. Syy tähän on regressio eli paluu keskiarvoon.

Ensimmäisenä päivänä menestynyt pelaaja todennäköisesti menestyy myös toisena päivänä, mutta ei yhtä hyvin kuin ensimmäisenä, koska hänellä ensimmäisenä päivänä ollut poikkeuksellinen onni ei todennäköisesti jatku. Ensimmäisenä päivänä huonosti menestynyt pelaaja on todennäköisesti keskiarvon alapuolella toisenakin päivänä, mutta hän parantaa, koska hänen todennäköinen huonon onnen kautensa ei luultavasti jatku.

Saman asian voi havainnollistaa myös nopalla. Jos olemme heittäneet nopalla vitosen, on todennäköistä, että seuraavan heittomme tulos on ensimmäistä pienempi. Jos tuloksena taas on ollut kakkonen, on todennäköistä, että parannamme toisella heitolla tulostamme.

Jos uhkapeluri sanoisi, että hän heitti nopalla ensin nelosen ja sitten vitosen, joten nyt on varmasti kutosen vuoro, osaisimme varmasti päätellä hänen olevan taikauskoinen ja sepittävän mielessään jotain sellaista mikä ei mene yksiin todellisuuden kanssa.

Kun kyse on arpakuutiosta, ihmismielen on helppo hyväksyä satunnainen vaihtelu. Kun kyse on urheilusuorituksesta, asia on monimutkaisempi. Mieli pyrkii järkeistämään satunnaisia tapahtumia ja luomaan niiden syistä uskottavan tarinan.

Mäkihyppy on hyvä esimerkki tästä. Kun hyvä hyppääjä epäonnistuu avauskierroksella ja palaa toisella kierroksella tasolleen, selostaja saattaa selitellä, että parantunut suoritus johtui paineettomuudesta. Kahneman muistaa itse kuulleensa tällaisen selostuksen. ”Selostaja oli ilmeisesti keksinyt paluun keskiarvoon ja sepittänyt kausaalisen tarinan, jolle ei ollut todisteita.”

Kahneman ei kiellä, etteikö osa ilmiöstä voisi olla tottakin. ”Kenties jos hyppääjien pulssit mitattaisiin ennen kutakin hyppyä, voitaisiin todeta, että he todella ovat rennompia huonon ensimmäisen hypyn jälkeen. Tai kenties ei.”

”Tärkeää on muistaa, että ensimmäisen ja toisen hypyn erilaisuus ei edellytä kausaalista selitystä. Se on matemaattisesti väistämätön seuraus siitä, että onni vaikutti ensimmäisen hypyn tulokseen.”

Kyse ei ole siitä, etteikö hyvältä urheilijalta odotettaisi tasaisuutta. Totta kai voi ja sitä pystyy jossain määrin opettelemaankin. Urheilijalle tulee kuitenkin lähes väistämättä tavallista parempia ja huonompia otteluita ja kisoja. Toisin sanoen huonon suorituksen jälkeen tulee parempi ja poikkeuksellisen hyvän jälkeen lopulta huonompi. Tärkeää on olla vetämättä yksittäisistä onnistumisista tai epäonnistumisista liian suuria johtopäätöksiä.

Miten tämä kaikki liittyy jalkapalloon? Monellakin tavalla. Esimerkistä käy vaikkapa valmennuskulttuuri. Joillakin valmentajilla on tapana huutaa pelaajilleen huonon ottelun jälkeen. Heidän kokemuksensa mukaan tämä toimii, koska pelaajat yleensä palaavat tasolleen ja pelaavat seuraavassa ottelussa paremmin.

Joku valmentajista on saattanut kokeilla myös kehuja poikkeuksellisen hyvän pelin jälkeen ja huomannut sitten suureksi yllätyksekseen, että pelaajat eivät pelanneetkaan seuraavassa ottelussa vielä paremmin vaan todennäköisesti huonommin. Näistä kahdesta kokemuksesta valmentaja on sitten raapustanut mielessään osiaan suuremman tarinan ja päätellyt, että huutaminen toimii kehumista paremmin.

Valmentaja on oikeassa siinä, että kummallekin tapaukselle on yhteinen selittäjä, mutta se ei ole keppi eikä porkkana vaan regressio. Peliesitysten muutokset olisivat olleet luultavasti samansuuntaisia vaikka valmentaja olisi lukenut pelaajilleen Eino Leinon runoja ja näyttänyt päälle perheensä lomakuvia.

Samat lainalaisuudet pätivät myös urheilutoimittajan ongelmaan. Veikkaajan kirous ei hellittänyt kun lehden nimi vaihdettiin Urheilusanomiksi, koska mitään kirousta ei ollut. On vain regressioilmiö.

Mainokset

4 ajatusta artikkelista “Regression monet kasvot

  1. Esimerkiksi regressiosta käy myös vaikkapa Robin Lodin hattutemppu Honkaa vastaan. Lod nosti tasoaan kauden aikana merkittävästi, mutta hattutemppu oli keskikenttäpelaajalta silti niin poikkeuksellinen teko, että se pomppaa esiin tilastoista. Jos keskikenttäpelaaja tekee yhdessä ottelussa kolme maalia, odotamme hänen osuvan myös seuraavissa peleissä. No, kolmessa seuraavassa ottelussa Lod ei osunut kertaakaan – kuten ei kolmessa pelissä ennen hattutemppuaan.

    Eikä kyse ole pelkästään Lodista. HJK-kärki Mikael Forssell teki hattutempun kauden viimeisessä pelissään. Varmasti edes tästä oli merkkejä ilmassa? Ei oikeastaan. Edellisissä viidessä pelissään Forssell oli osunut vain kerran.

    En laittanut tätä juttuun, koska minulla ei ole tilastoja tukenani, mutta oli kyse jalkapallosta tai jääkiekosta, niin hattutemput ovat satunnaisia. Ne ovat niin poikkeuksellisia tapahtumia, etteivät ne seuraa toisiaan. Hattutemput tulevat ”tyhjästä” ja häviävät yhtä nopeasti kuin ovat tulleet. Jonkinlaisen poikkeuksen sääntöön tekevät aivan huippupelaajat. Messi, Zlatan ja Ronaldo voivat paukutella säännöllisesti kahta maalia per peli, koska se on heidän keskimääräinen tasonsa Almerioita ja Bastioita vastaan. Ja kun normaalitaso on kahdessa maalissa 0,5 maalin (per peli) sijaan, hattutemppujakin tulee säännöllisemmin.

    Kun tavallisilla pelaajilla satunnaisvaihtelun yläpää (= suuri menestys) on 2-3 maalissa, Messillä ja Zlatanilla se on 4-5 maalissa. Ja välillä heillekin tulee maalittomia otteluita. Supertähdet tuntuvat toisinaan uhmaavan fysiikan lakeja, mutta hekään eivät pääse regressiota karkuun.

    • En malta olla kommentoimatta tähän. Olin vähän sitä alunperin, että ei tuo hattutemppu ole niin satunnainen kuin esitit, ja tsekkasimpa tuon HJK:n tilastoja: kolme hattutemppua joukkueella tekijöinä Forssell, Lod ja Pohjanpalo.

      Pitäisikö noita sitten olla vähemmän vai enemmän? Joukkue teki 78 maalia 33 ottelussa. Mietin, että olisiko joukkueen maalijakauma Poissonin jakauman kaltainen, jolloin 2,36 keskiarvolla pitäisi saada seuraavasti maaleja:
      0 maalia kolmessa pelissä, mutta oikeassa elämässä niitä oli kuusi
      1 maali seitsemässä pelissä mutta todellisuudessa viisi
      2 maalia yhdeksässä pelissä -> 8
      3 maalia seitsemässä pelissä -> 6
      4 maalia neljässä pelisssä -> 4
      5 maalia kahdessa pelissä -> 2
      6 maalia yhdessä pelissä -> 2

      Mutta tämä ei oikeastaan kerro hattutempuista mitään, vaikka Poisson näyttäisi arvaavan tehdyt maalimäärät kohtuullisen hyvin.

      Otetaan Forsell ja 14/27 = 0,51 ja heitetään se Excelin Poisson-kaavaan:
      0 1 2 3
      Poisson 60% 31% 8% 1% 0%
      Forssell 63% 26% 7% 4% 0%

      Tämän mukaan Forssell ylisuoritti vain tuon hattutempun kohdalla, mutta ei ihan hirveästi. Hattutemppua voi odottaa silloin jos mättää noin 20 maalia 33 pelissä Poissonin mukaan. Forssel jäi neljääntoista.

      Sitten Lod – ja tässähän olit ihan oikeassa:
      0 1 2 3
      Poisson 78% 19% 2% 0% 0%
      Lod 86% 7% 4% 4% 0%

      Lodin olisi pitänyt maalata kuudessa matsissa kerran mutta teki vain kahdessa matsissa yhden maalin. Kahta tai kolmea maalia ei olisi pitänyt lainkaan tulla, mutta niitähän tuli kerran kumpaakin.

      Lodin hattutemppu tuli lähes tyhjästä. Ennen sitä hän oli tehnyt vain yhden maalin, mutta Lodilla oli kyllä paljon laukauksia alla – 38 tuli täyteen tällä kaudella. Maaleja kyllä odoteltiin – joskus jopa hartaasti. Hattutempun jälkeen meni kolme matsia ja sitten hän teki kaksi Lahtea vastaan. Yksi vielä VPS:ää vastaan loppukaudesta. Näissä kolmessa pelissä on erikoista se, että Lodin lisäksi vain Tainio teki maalin Honka matsissa.

      • Kovaa numerofaktaa jälleen kerran, kiitos siitä. Forssell oli kieltämättä siinä mielessä heikosti pohjustettu haku, että tuolla 0,5 maalilla per peli hattutemppukin tulee yleensä jossain vaiheessa – ei välttämättä yhden kauden aikana mutta kuitenkin.

        Varsinainen pointtini oli siinä, että hattutempun ajankohtaa ei voi juuri ennustaa. Kuten Lodin tapaus osoitti, kolmen maalin pelit tulevat toisinaan tyhjästä eikä yksi hattutemppu kauden alussa tarkoita sitä, että pelaaja tekisi toisen vielä ennen kauden loppua. (Tämä taas johtaa Veikkaajan ”kiroukseen”: kun kauden odotettavissa oleva huippuilta on jo käytetty, niin toista ei ole heti luvassa ja suunta on ”alaspäin” eli keskiarvoon.)

        Veikkausliiga-historian paras empiirinen hattutemppukoe on eniten VL-maaleja tehnyt Valeri Popovits. Tsaari teki kaikkiaan kuusi hattutemppua, kaikki eri kausina. Kun katsoo Popovitsin kausia 1993-2005 olisi ollut vaikea ennustaa etukäteen minä kausi hattu tulee ja minä ei. Kuudesta tehokkaimmasta kaudesta neljä toi toki knallin, mutta myös 9 ja 10 maalin kausille osui hattutemppu, mutta 21 maalin kaudelle ei.

        Hattutemppu
        1993 26/9
        1996 26/12
        1999 29/23
        2000 19/13
        2002 29/17
        2004 26/10

        Ei hattutemppua
        1994 23/8
        1995 24/21
        1998 27/10
        2001 29/8
        2003 26/11
        2005 26/9

        Jos sitten kaivetaan esiin ne pelaajat, jotka ovat tehneet vähintään kaksi hattutemppua Veikkausliiga-kauden aikana, huomataan, että he ovat ns. outlaijereita. Kukaan heistä ei voittanut tupla- tai triplahattutemppukaudellaan maalikuninkuutta. Hattutemppujen maalit kattoivat keskimäärin lähes puolet (43-75 prosenttia) heidän maalisaaliistaan, vaikka ne ottelut joissa hattutemput syntyivät kattoivat vain 6-11 prosenttia heidän kaudestaan.

        (Ari Tegelberg teki kaksi hattutemppua kaudella 1994, vaikka maaleja syntyi 26 ottelussa ”vain” 11. Muut väh. kahden hattutempun kausiin pystyneet ovat Jari Niemi (2000: 14 maalia 31 ottelussa), Petteri Kaijasilta 2002 (13/24), David Carlsson 2005 (14/25), Paulus Roiha 2008 (8/18) sekä Ismo Lius joka hattuili peräti kolmesti kaudella 1992 (21/27).)

  2. Joo oikeassa olet tämän ennustamattomuuden sekä tietenkin regression (blogin alkuperäisen aiheen!) suhteen. Tarkoitus oli vain tarkistaa nuo esimerkit Poissonin avulla – en ollut tähän tarkoitukseen sitä käyttänyt. Yleensähän sitä käytetään otteluiden tuloksia ennustettaessa.

    Ennustettavuuteen vielä sen verran, että varmaan kauden alussa nimenomaan Forssellia povattiin vahvimmaksi maalintekijäksi, ja siinä mielessä suoritus ei ollut yllätys. Samoin Sihvola olisi voinut veikata hattutempun tekijäksi – hän osui vain liian aikaisin – LiigaCupissa. Ehkä Venäläinen ja Sirbiladze vielä olivat niitä pelaajia kauden alussa joista olisi uskonut hattutempun tekijöiksi.

    Tuo Popovits on kyllä hieno tilastollinen esimerkki, mutta myös ainutlaatuinen sinällään. Onko niin että vain hän ja Pohjanpalo olisivat tehneet peräkkäisinä kausina hattutempun? Pohjanpalo teki hattutemppunsa Maarianhaminaa vastaan ensin kotona sitten vieraissa. Hän vielä paukutteli neljä hattutemppua Klubi04:ssa kaudella 2011 ja yhteensä 33 maalia kakkosessa, eli kolmella kaudella peräkkäin vaikkakin eri sarjassa. Pohjanpalolla siis aikuisten sarjoissa jo saman verran hattutemppuja kuin Popovitsilla!

    Popovitsin sarjassa siis 95 vuonna olisi odottanut hattutemppua, vaan ei 96. Muutenhan tuo vuodesta 98 lähtien menee nätisti joka toinen vuosi. Ilmeisesti vuonna 97 ei tullut hattutemppua. Uskomaton mies.

    Keräsin myös kauden ajalta kaikista joukkueista kolme maalia ja enemmän tehdyt ottelut, ja niiden perusteella noin joka kuudenteen yli kolmen maalin matsiin 2013 sattui hattutemppu. HJK:lla (14, Forssell, Lod, Pohjanpalo), Honka (7, Väyrynen), KuPS (5, Venäläinen, Paananen), Lahti (7, Rafael). Jaron Jonke oli ainoa, jossa seura jäi vain kahteen vähintään kolmen maalin otteluun, mutta pelaaja pystyi hattutemppuun. Neljä maalia Lahtea vastaan 7-1 voitossa. Myös KuPS on ylisuorittaja hattutempuissa. Toisaalta MIFK (8) ja MyPa (5) pelasivat suurimaalisia otteluita, mutteivät saaneet hattutemppua aikaan. Sitten JJK (2), Inter (2), TPS (2) ja RoPS (3) pelasivat vähämaalisia pelejä, ja maalintekijöitäkään ei juuri seuroista löytynyt tällä kaudella.

    Muilta kausilta hattutemppuja:
    2012 Morrissey, Markkanen, Pohjanpalo, Pelvas, Robinsson
    2011 Pukki, Ääritalo, Venäläinen, Wusu, O’Neill, Furuholm

    Eli tällä kaudella tulikin enemmän kuin aikaisemmilla kausilla, mutta koska näitä pitää laskeskella googlen avulla, niin pitempää sarjaa en jaksanut katsoa kuin tämän viimeisimmän 33-ottelun sarjan. Alkaa olla salapoliisityötä. Samoin tällä kaudella jostain syystä hattutemput menivät pääsääntöisesti kärkimaalintekijöille. Viime kaudellahan vain Morrissey ja Pohjanpalo, ja kaudella 2011 Furuholm, Wusu ja Pukki, olivat kärkikymmenikössä maalintekijätilastoissa, ja niin varmaan yleensä meneekin, kuten totesit näistä useamman hattutempun tekijöistä.

    Hattutemppuilu ei taida olla taito- vaan tuurilaji, vaikka Popovitsillä ja Pohjanpalolla on sitten ollut melkoisesti tuuria.

    Jos tuota nyt haluaisi yhteen vetää, niin 33 ottelun sarjassa Suomessa:
    – Hattutemppuja kaudessa noin kuusi, 3 % otteluista
    – Hattutemput viidelle eri seuralle kaudessa
    – Suurimaalisissa otteluissa hattutemppuja 14% otteluista

    En pitäisi tätä minään suurena totuutena, koska tuo otos on niin pieni. Samoin nämä tilastot on koottu käsin, joten varmasti näissä virheitä piilee.

Vastaa

Täytä tietosi alle tai klikkaa kuvaketta kirjautuaksesi sisään:

WordPress.com-logo

Olet kommentoimassa WordPress.com -tilin nimissä. Log Out /  Muuta )

Google+ photo

Olet kommentoimassa Google+ -tilin nimissä. Log Out /  Muuta )

Twitter-kuva

Olet kommentoimassa Twitter -tilin nimissä. Log Out /  Muuta )

Facebook-kuva

Olet kommentoimassa Facebook -tilin nimissä. Log Out /  Muuta )

Muodostetaan yhteyttä palveluun %s