Tilastoanalytiikka

Raipe - The Great One

Tähtipelaaja
Viestejä
11 492
Tästä en ainakaan löytänyt mitään ketjua tänne.



Ruotsissa jopa 6 seurassa on käytössä tälläinen rooli, jossa osalla myös toinenkin rooli analyytikon lisäksi. Suomessa on kahdessa seurassa käytössä tilastoanalyytikko, josta Arponen viimeisimpänä meni Ässiin. Olisiko meillä Ilveksessä käyttöä ? Mielestäni olisi.
 

Pantterin Pensselit

Luottopelaaja
Viestejä
1 277
Tästä en ainakaan löytänyt mitään ketjua tänne.



Ruotsissa jopa 6 seurassa on käytössä tälläinen rooli, jossa osalla myös toinenkin rooli analyytikon lisäksi. Suomessa on kahdessa seurassa käytössä tilastoanalyytikko, josta Arponen viimeisimpänä meni Ässiin. Olisiko meillä Ilveksessä käyttöä ? Mielestäni olisi.

Ainakin Kärpillä ilmeisesti Santeri Hilli teki tämän tyylisiä hommia videovalmennuksen lisäksi. Olisi kyllä ehdottomasti käyttöä meilläkin.
 

Raipen Lätty

Luottopelaaja
Ylläpidon jäsen
Viestejä
2 525
Jääkiekko muiden urheilulajien tapaan on enemmän ja vähemmän odottaman eli odotusarvojen maksimointia, kun halutaan menestyä ja olla parhaita.

Jääkiekkokin on nykypäivänä purettu luvuiksi, joista voidaan tilastoanalyysillä tehdä tilastotieteellisiä johtopäätöksiä. Kyse on lähinnä siitä, kuinka paljon meillä on dataa, jotta riittävän luotettavia johtopäätöksiä voidaan tehdä.

Mitkä tahot tuottavat ns. raakadataa Liigasta? Liiga ainakin näyttää omilla sivuillaan aika köykäisesti tilastoja. Toki perustilastot löytyy.
 

IhanJuniori

Junioripelaaja
Viestejä
17 582
Jääkiekkokin on nykypäivänä purettu luvuiksi, joista voidaan tilastoanalyysillä tehdä tilastotieteellisiä johtopäätöksiä. Kyse on lähinnä siitä, kuinka paljon meillä on dataa, jotta riittävän luotettavia johtopäätöksiä voidaan tehdä.
Tästä hyvä esimerkki on Tappara alkukaudesta.
He olivat melkein kaikissa peleissä edellä maaliodottamassa, ja tilastoissa jotka ennustavat pelien lopputuloksia.
Olivat siis näissä tilastoissa liigan kärjessä vaikka pisteitä ei tullut. Tapolalta jossain haastattelussa sitten kysyttiin "mitä Tapparan pitää tehdä toisin" niin vastasi siihen "ei mitään" ja tätä ihmeteltiin erittäin paljon. No he eivät muuttaneet mitään, ja lopputulos on yhtä voittoa vaille mestaruus tällä hetkellä.
Siellä siis tehtiin "oikeita asioita" mutta ei tullut tulosta ja luotettiin siihen, että kyllä sitä tulosta alkaa vielä tulemaan.
 

mindfcuk

Vakiokokoonpanossa
Viestejä
580
Jääkiekko muiden urheilulajien tapaan on enemmän ja vähemmän odottaman eli odotusarvojen maksimointia, kun halutaan menestyä ja olla parhaita.

Jääkiekkokin on nykypäivänä purettu luvuiksi, joista voidaan tilastoanalyysillä tehdä tilastotieteellisiä johtopäätöksiä. Kyse on lähinnä siitä, kuinka paljon meillä on dataa, jotta riittävän luotettavia johtopäätöksiä voidaan tehdä.

Mitkä tahot tuottavat ns. raakadataa Liigasta? Liiga ainakin näyttää omilla sivuillaan aika köykäisesti tilastoja. Toki perustilastot löytyy.

Liigasta on dataa saatavilla tosi kattavasti, kiitos Wisehockeyn. Kehittävät ymmärtääkseni jatkuvasti vielä lisää tuota järjestelmää. Esimerkiksi suoraan videon perusteella voisi olla mahdollista tilastoida maalivahdin positioita eri tilanteissa, lämäri/ranne/rysty-laukaisutyypit jne.

Suurin osa Wisehockeyn datasta ei tietenkään ole julkisesti saatavilla (ainakaan vielä), mutta uskoisin, että seuroilla on mahdollisuus näihin datoihin päästä kiinni.
 

Seisomisurheilu

Luottopelaaja
Viestejä
2 440
Ei mitään pahaa analyytikoille mutta eikö tommosta roolia pysty apuvalmentaja hoitamaan? Vai onko tilastoanalyytikko toinen kutsumanimi skoutille?
 

S_Kuusisto

Vakiokokoonpanossa
Viestejä
543
Okei, on mennyt itsellä ihan ohi.
Joo, ei ole aiheesta mitään käsittääkseni julkisuuteen tiedotettu. Voi se olla tietysti freelancerikin, samaan tyyliin kuin Arponen oli Ässille ennen "sopimusuutista" - en tiedä tarkemmin tuosta kuviosta. Mutta data-analyytikko on, sen tiedän.
 

Tarinankertoja

Luottopelaaja
Viestejä
3 450
Liigasta on dataa saatavilla tosi kattavasti, kiitos Wisehockeyn.

Ovat kehittäneet kyllä ihan hyvin siitä alkuaikojen paikkapistetarkastelusta.

Edelleen A.I ja konenäön hyödyntäminen on lapsenkengissä, mutta näyttäs siltä, että Suomessa on menty Kanadan ohi tässä, sillä Toronton yliopiston hankkeen tutkimuspaperit on jääny köykäsiksi. Edellen silti teollisuuspuolen A.I. oppeja pitäs vaan rohkeesti lähtee hakemaan urheilun puolelle. Tietty resurssikysymys (raha), joten Wisehockeynkin kandeis kääntyä futissovelluksien kehittämisen puoleen, siä on eniten rahaa (ja toki kilpailua)
 

Tarinankertoja

Luottopelaaja
Viestejä
3 450
Mainitaan nyt viä sen verran, että jääkiekkotilastoinnin edistyneessä muodossa, eli esim xG tilastoinnissa on ongelmana se, että siihen ei ole mitään standardisointia olemassa, vaan jokainen xG dataa tuottava taho tekee ne omin kriteerein. Näin mitään vertailukelpoista dataa eri lähteistä ei tule.

Tämä taas vaikeuttaa jälkianalyysejä huomattavasti. Tietty tässä on kyse kilpailutilanteesta kun haetaan tehokkaita analyysimenetelmiä kuvaamaan todellisuutta ja parhaat tavat, algoritmit ja AI on kilpailuvaltti.


Mutta jossain vaiheessa tän täytyy mennä yliopistotutkimuksen kautta, jossa analyysitavoille haetaan standardeja ja yhteisiä rakenteita. Muuten esim datalouhinta ei tule edistymään

Koska jos jokaisella joukkueella on omat standardit, jokaisella Liigalla on eri standardit jne. jne. ja massalouhinnan teho paranee sen massan kasvaessa niin kun data on eri "formaateissa" ei tätä massalouhintaetua tulla saavuttamaan.
 

mindfcuk

Vakiokokoonpanossa
Viestejä
580
@oowee

Ihan mielenkiinnosta, kun jatkuvasti suollat tarinaa siitä, miten xG on turhaa p*skaa ja perustelet sitä CSA:n analytiikalla: mihin CSA:n analytiikka sitten perustuu?

1: https://twitter.com/csahockey

"Clear Sight Analytics is changing the game of hockey with cutting-edge team and player based performance data built around the quality of scoring chances."

Mitä xG on, ellei se ole summa yksittäisten maalintekomahdollisuuksien todennäköisyyksistä?

2: Pelkkä Twitter -feed on täynnä xG -tilastointia :D

3: https://www.csahockey.com/csa-hockey-training-system

CSA is changing the game of hockey with cutting edge team and player-based performance data built around the actual quality of scoring chances. CSA’s proprietary methodology systematically catalogs every shot sequence resulting in a shot on goal for every game played in the NHL, using 34 individual standardized points of data including for example, passer, passer location, shooter, shooter location, offensive situation, screens, deflections, broken plays, and the results of the shot sequence, including rebounds, whistles, and goals.

Toisin sanoen, se on tilastollinen malli, joka ottaa tietyn määrän (34) parametreja mukaan ja laskee niiden perusteella maaliteon todennäköisyyttä.

Tarvitseeko sinulle kaivaa vielä lisää tekstiä? Bottom line: CSA käyttää xG:tä tärkeimpänä mittarina. xG ei ole mikään "vakioitu" asia, vaan se on tilastollinen malli. Vertaa sitä vaikkapa FMI:n tai Forecan sääennusteisiin. Ne näyttää tuleville päiville erilaisia ennusteita, koska säämallit perustuvat eri parametreihin. Sama CSA:n ja vaikkapa Liigaplotin välillä. CSA:lla on käytössä kattavampi malli, koska NHL:ssä tilastointi on hieman eri tasoa. Tilastomalleja myös korjataan, koska esimerkiksi pelityylit yms. vaikuttavat asiaan (pelityylit jne.).

Telian xG -malli (ja mahdollisesti Veikkauksen xG -malli) taas voi olla aika paljonkin kattavampia ja tarkempia Liigaplotiin verrattuna. En tiedä, saako Veikkaus käsiin Wisehockeyn dataa. Wisehockeyn datasta voidaan katsoa syöttöjä, pelitilanteita, maalivahdin asennoitumista, laukauksen kohdistusta maaliin suhteutettuna, jne., jolloin syöteparametrien määrä on paljon suurempi.
 

oowee

Vakiokokoonpanossa
Viestejä
681
@oowee

Ihan mielenkiinnosta, kun jatkuvasti suollat tarinaa siitä, miten xG on turhaa p*skaa ja perustelet sitä CSA:n analytiikalla: mihin CSA:n analytiikka sitten perustuu?

1: https://twitter.com/csahockey



Mitä xG on, ellei se ole summa yksittäisten maalintekomahdollisuuksien todennäköisyyksistä?

2: Pelkkä Twitter -feed on täynnä xG -tilastointia :D

3: https://www.csahockey.com/csa-hockey-training-system



Toisin sanoen, se on tilastollinen malli, joka ottaa tietyn määrän (34) parametreja mukaan ja laskee niiden perusteella maaliteon todennäköisyyttä.

Tarvitseeko sinulle kaivaa vielä lisää tekstiä? Bottom line: CSA käyttää xG:tä tärkeimpänä mittarina. xG ei ole mikään "vakioitu" asia, vaan se on tilastollinen malli. Vertaa sitä vaikkapa FMI:n tai Forecan sääennusteisiin. Ne näyttää tuleville päiville erilaisia ennusteita, koska säämallit perustuvat eri parametreihin. Sama CSA:n ja vaikkapa Liigaplotin välillä. CSA:lla on käytössä kattavampi malli, koska NHL:ssä tilastointi on hieman eri tasoa. Tilastomalleja myös korjataan, koska esimerkiksi pelityylit yms. vaikuttavat asiaan (pelityylit jne.).

Telian xG -malli (ja mahdollisesti Veikkauksen xG -malli) taas voi olla aika paljonkin kattavampia ja tarkempia Liigaplotiin verrattuna. En tiedä, saako Veikkaus käsiin Wisehockeyn dataa. Wisehockeyn datasta voidaan katsoa syöttöjä, pelitilanteita, maalivahdin asennoitumista, laukauksen kohdistusta maaliin suhteutettuna, jne., jolloin syöteparametrien määrä on paljon suurempi.

En väitä, että maaliolettama on pskaa vaan meillä käytetty on paskaa. Ja corsit vasta paskaa on.

CSA:lla ne tilastot luodaan katsomalla pelin tilanteet.

Valiquette avaa tämän esim InGoalin podcastissa.


Wisehockey ei saanut edes alkukaudesta laukauksia tilastoitua jos veto tuli läheltä maalivahtia. Lisäksi laukaisukartat on usein päin persettä.

C41A4A00-6EAD-4F42-B769-5C6F282F28E7.jpeg


Olin paikalla ja vedot eivät tulleet keskialueelta, eivät edes viivan tasolta.

Laskennassa huomioidaan syöttöjä jne mutta CSA:n mallissa syötön laatu (pomppiiko kiekko), ylitetäänkö ”royal road”, onko maalilla ruuhkaa jne vaikuttavat kaikki tilastoon.

Eli pelkkään dataan perustuvat tilastot ovat melkoista paskaa koska data ei sisällä kaikkia muuttujia eikä se ole edes usein kuranttia.

Jos tehdään tiedettä, tehdään se kunnolla.
 
Viimeksi muokattu:

oowee

Vakiokokoonpanossa
Viestejä
681
Niin, toisaalta kai KooKoo on päässyt testaamaan siten, että olisivat voineet tehdä enemmän maaleja kuin ovat tehneet, jos Heljanko olisi ollut huono. Kouvolan pelissä maaliodottamat taisivat olla jotain luokkaa 3-4 ja peli päättyi 1-6. Tappara on ollut ylivoimainen, mutta eihän se estä sitä, että maalivahtikin on ollut todella hyvä.

Taponen kai näiden pleijareiden paras maalivahti on tähän mennessä ollut, mutta Langhamer varmaankin on Liigan paras maalivahti.

Edelleen, niin kauan kuin nuo maaliodottomat perustuvat laukaisukarttaan ilman mitään tiedon rikastamista niin niillä voi heittää vesilintua
 

IhanJuniori

Junioripelaaja
Viestejä
17 582
Edelleen, niin kauan kuin nuo maaliodottomat perustuvat laukaisukarttaan ilman mitään tiedon rikastamista niin niillä voi heittää vesilintua
Wisehockey kerää aikas hyvin dataa minkä perusteella tekevät noi maaliodottamat.

Se Liigaplot twitter tili käyttää ihan pelkkää laukaisukarttaa ja sen takia heidän maaliodottama poikkeaa välillä aikas paljon tuosta wisehockeyn.
 
Ylös