Vs: Otto Koivula
Stefan sanoi:
Ei poista sitä matemaattista tosiasiaa että edelleenkin ne sarjapisteet muodostuu tehtyjen ja päästettyjen maalien suhteesta toisiinsa. Helmitaulua käteen 8)
Ja pahoittelut hieman provokatiivisesta tekstistä. Mutta kun nousee oikein savu korvista kun joutuu näin yksinkertaisesta asiasta vääntämään ratakiskoa.
Jaa että sarjapisteet muodostuu tehtyjen ja päästettyjen maalien suhteesta toisiinsa? No ei muuten johdu. Pelin sisällä näin, mutta ei sarjan aikana. 2-1 voitosta tulee 3p, 6-6 tasurista 1p tai 2p, 0-8 tappiosta 0p
maalit 8-15, pisteet 3 ottelua 5p
Ja sitten jos nyt ihan totta heitetään, niin tilastomatematiikka ei ole mitenkään yksinkertaista ratakiskoa, vaan erittäin monimutkasta laskentaa, jota ei nykyään juurikaan käsin edes lasketa. Otetaan tämmönen simppeli yksinkertainen juttu… tekeekö raiti enemmän maaleja kun leftit?
vaikka toissa kaudelta… vähintään yhden maalin liigakauden teki 339 pelaaja maalimäärän jakaantuessa 1 ja 28 maalin välille. Keskimäärin pelaaja tekee 6,27 maalia kaudessa (keskiarvo). Näistä rightin maalintekijöitä on aineistossa 91 kpl ja heidän maalikeskiarvonsa oli 7,3 maalia /ottelu (keskiarvo). Leftin maalintekijöitä tilastossa on 248 pelaajaa, jotka tekivät keskimäärin 5,9 maalia /ottelu (keskiarvo). Jos huomioon otetaan myös ne 124 pelaajaa, jotka eivät kauden aikana tehneet maalia, on Leftin pelaajien osuus kaikista pelaajista (maalintekijöistä ja maalia tekemättömistä) on 75,4% ja rightin pelaajia on 24,6%. Huolimatta maalittomien pelaajien lisäämisestä otokseen, maaleista rightin pelaajien osuus 31,2%.
Joo, kyllä, simppeliä matikkaa (keskiarvoahan ei tarttene selittää?), mutta toihan ei kerro viä mitään siitä, voiko tulokseen luottaa. Keskihajontakin tosta tietty pitäisi laskea, koska Chad Rau (right) ja Zaborsky (left) teki niin paljon enemmän maaleja kun suurin osa muista…
Mutta aina täytyy muistaa, että satunnaisotokseen sisältyy a i n a virhettä, sillä otos edustaa tutkittavaa populaatiota aina epätäydellisesti. Virhemarginaalin kuvaamiseen käytetään luottamusvälejä. Luottamusväli ilmoitetaan otoksesta arvioidulle tunnusluvulle, kuten nyt tälle meitin keskiarvolle. Yleensä ilmoitetaan 95% luottamusväli. Sen tarkottaa, että ollaan 95 prosenttisen varmoja siitä, että saatu tulos pitää paikkansa. Toisin sanoen, luottamusväli kertoo, mille välille otoksesta mitattava tunnusluku sijoittuisi 95 kertaa, jos otosta toistettaisiin sata kertaa.
Eli tulee tehdä kahden riippumattoman otoksen t-testi. Tähän tartetaan väite, jota testataan. Otetaan nollahypoteesiksi (H0) vaikka, että pelaajan kätisyydellä ei olisi merkitystä pelaajan tekemiin maalimääriin. Eli tämä tarkoittasi, että sekä rightin että leftin pelaajien maalimääräkeskiarvo on yhtä suuri. Vastahypoteesi (H1) on luonnollisesti se, että kätisyys vaikuttaa pelaajan tekemiini maalimääriin, eli muuttujan keskiarvot ovat erisuuret. Tätä tutkitaan siis luottamusvälin ollessa 95%.
pistetään nää tilastomatikkasoftaan...
Rightin pelaajien maalimääräkeskiarvo on 7,3 maalia ((keskihajonta = 5,746, n=91) ja leftin pelaajien 5,9 (keskihajonta = 5,065, n=248).
Sitten katotaan merkittävyys. Merkitsevyyden mittarina käytetään usein p-arvoa. Sitä tulkitaan niin, että mitä pienempi p-arvo on, sitä todennäköisemmin ryhmien välillä havaittu ero ei johdu pelkästään sattumasta. Usein tilastollisen merkitsevyyden rajana pidetään arvoa 0.05, mutta arvo voi olla jokin muukin. Ryhmien väliset erot tulkitaan merkitseviksi, mikäli p on 0.05 tai sitä pienempi luku. Tilastollisessa testauksessa tasapainoillaan kahden mahdollisen virheen välillä:
I-tyypin virhe: tilastollinen testi osoittaa eron ryhmien välillä, vaikka todellisuudessa ero on pelkkää sattumaa. Eli nollahypoteesi on oikein, mutta se hylätään väärin perustein. Tätä kutsutaan myös hylkäysvirheeksi.
II-tyypin virhe: nollahypoteesi ei ole oikein, mutta testi hyväksyy sen. Eri ryhmien välillä on todellisuudessa ero, mutta se jää havaitsematta. Tätä kutsutaan hyväksymisvirheeksi.
Yleensä pyritään minimoimaan tyypin I virheen mahdollisuus. Rajana käytetty 0.05 tarkoittaa sitä, että on 5 prosentin mahdollisuus tehdä tyypin I virhe.
No tän maalintekijätilaston p-arvo on 0,263 (eli se on >0,050). ja näin voimme todeta, että t-testin perusteella ero on merkitsevä: t(337) = -2,170, p = ,031 (2-suuntainen). 95 % luottamusväli on -2,664:stä -0,131:teen t arvon ollessa selkeästi luottamusvälillä..
Koska otosten keskiarvot poikkeavat toisistaan, voidaan perustellusti esittää, että pelaajan kätisyys vaikuttaa pelaajan tekemään maalimäärään.
Aika selvä keissi, mutta sen todistelu tilastomatikalla ei siis ole mitään palikkamatikkaa. Tossa ei edes ole katottu korrelaatioita, riskisuhteita eikä ristituloksia