Autorem tekstu jest Michał Miłkowski, który zawodowo zajmuje się statystyką i jest pasjonatem piłki nożnej. Owocem tego związku jest jego strona: O futbolu statystycznie
Statystyka pomaga nam znajdować związki z otaczającej nas rzeczywistości. Piłka nożna nie jest tu wyjątkiem i liczby oraz ich matematyczne zrozumienie, odgrywają w futbolu ogromną rolę. Zwłaszcza jest to widoczne w analizie poszczególnych meczów, a także formy drużyn i zawodników na przestrzeni całego sezonu. Dzisiaj skupmy się na samych zawodnikach.
Jak policzyć wagę idealnego piłkarza?
Wykorzystując dostępne dane i narzędzia statystyczne jesteśmy w stanie określić przeciętną masę ciała piłkarza w zależności od jego wzrostu i wieku. Co ważne, wyznaczyłem to na podstawie danych zawodników z 5 najlepszych lig na świecie, czyli wśród piłkarzy, którzy osiągnęli sukces w tym sporcie. Oto wzór:
Waga (kg) = -75,99 + 0,804 * wzrost (cm) + 0,171 * wiek (lata)
Zaczęło się od najważniejszej informacji, a teraz przejdźmy do całej historii, która się za tym wzorem kryje. Aha, i od razu ustalmy „idealna” masa zawodnika jest uśrednieniem. Może nam dać pewne wyobrażenie o posturze zawodników i pomóc zrozumieć rolę masy ciała w tym sporcie. Lecz nie powinna być traktowana jak bezwzględny cel i z pewnością wielu znakomitych zawodników nie ma „idealnej” wagi.
Profesjonalni piłkarze to ciekawa próba badawcza. Futbol jest bardzo uniwersalny, obecny na całym świecie. Najlepsi piłkarze pochodzą ze wszystkich kontynentów i grup etnicznych. Specyfika gry daje miejsce do popisu zarówno dla niskich i wysokich, szczupłych i potężnie zbudowanych
Czego się dowiesz?
Tekst będzie podzielony na 4 części. W zależności od Twojego podejścia do tematu, zrezygnujesz z dalszego czytania w odpowiednim dla Ciebie momencie. Albo doczytasz do samego końca z zainteresowaniem, na co liczę 🙂
– pierwsza część to pogłębiona analiza relacji wzrostu i wagi, a konkretnie wzór na optymalną wagę przy danym wzroście
– część druga to nieco pogłębiona analiza wagi i wzrostu piłkarzy (np. jakie znaczenie ma pozycja na boisku)
– część trzecia to opis danych, bo tego wymaga rzetelność
– ostatnia część to fragment szczegółów statystycznych (algorytmy, testy) dla tych, którzy oczekują od „O futbolu statystycznie” ciekawej analityki, którą obiecywałem, a którą tym postem chcę zapoczątkować. Statystyka to nie tylko kilka cyferek jak w księgowości, ale przede wszystkim wyciąganie wniosków z danych.
Cześć trzecia i czwarta są dostępne w postaci pliku PDF do pobrania.
Część 1: modele „optymalnej” wagi
Tyle wstępu, przejdźmy do sedna sprawy. Przedstawię Wam 3 różne modele statystyczne.
Model 1 – zależność wagi od wzrostu (wykres 1)
Na podstawie danych 1636 profesjonalnych piłkarzy z lig top 5 zbudowany został model regresji liniowej, który mówi, że:
Waga (kg) = -73,258 + 0,814 * wzrost (cm)
To oznacza, że aby obliczyć wagę dla danego wzrostu, należy ten wzrost w centymetrach pomnożyć przez 0,814 i odjąć od wyniku 73,258 kg. Wzór ten oznacza również, że z każdym dodatkowym centymetrem wzrostu waga przeciętnie powinna być o 814 gramów większa. Jak się to ma do bardzo popularnego wskaźnika BMI? Otóż bardzo dobrze. BMI praktycznie dla każdego wzrostu dla wyznaczonej przez model wagi (linia pomarańczowa) jest bardzo podobne pomiędzy 22,34 a 22,61 (linia niebieska – prawa oś). Są to wartości mniej więcej w środku optymalnego przedziału BMI i oznacza, że zawodnicy generalnie trzymają masę ciała, którą uznajemy za „zdrową”.
No dobrze, wygląda ciekawie, ale wydało nam się słuszne uwzględnić w modelu również wiek. Banalną obserwacją jest, że u zwykłych ludzi masa ciała wzrasta wraz z wiekiem. Czy u piłkarzy jest tak samo? Właśnie tak powstał kolejny model.
Model 2 – zależność wagi od wzrostu i wieku (wykres 2)
Na podstawie tych samych danych zbudowany został drugi, bardziej rozbudowany model regresji liniowej. Drugi model jest tak naprawdę modelem docelowym i podanym na początku tego wpisu. Uwzględnia on również wiek, który okazuje się być statystycznie istotny. Model ten prezentuje się następująco:
Waga (kg) = -75,99 + 0,804 * wzrost (cm) + 0,171 * wiek (lata)
To oznacza, że aby obliczyć wagę dla danego wzrostu i wieku, należy ten wzrost w centymetrach pomnożyć przez 0,804 i odjąć od wyniku 75,99 kg oraz dodać 0,171 kg razy wiek. Z każdym rokiem życia waga piłkarza przeciętnie wzrasta o 171 gramów przy tym samym wzroście. Zatem możemy założyć, że zdrowa różnica między (stan na styczeń 2021) 35-letnim (np. Cristiano Ronaldo) a 17-letnim (np. Jude Bellingham) piłkarzem o tym samym wzroście wyniesie 18*0,171 kg = 2,078 kg. Jest to z pewnością znacznie mniejsza różnica niż między 17, a 35 letnim Kowalskim. Ech… waga z liceum…
Wykres 2 przedstawia zależność wagi od wzrostu dla zawodników w wieku kolejno od najniższej linii 17, 22, 27, 32 i 37 lat.
Model 3 – zależność wagi od wzrostu i wieku dla najdroższych piłkarzy (wykres 3)
Poprzednie 2 modele zostały przygotowane na bazie wszystkich dostępnych piłkarzy. Czy jednak relacja wagi i wzrostu może wpływać na poziom zawodnika? Czy szczupły zawodnik może być lepszy, jeśli zbuduje masę mięśniową lub zredukuje masę ciała? Jak wygląda idealna waga dla naprawdę wybitnego piłkarza?
Oczywiście jest to kwestia bardzo złożona, lecz w dużym uproszczeniu postanowiłem się temu przyjrzeć. Jak? Dla każdej wartości wzrostu wybrałem 5 najdroższych piłkarzy z zastrzeżeniem, że ich wartość musi przekraczać 25 milionów euro (według Transfermarkt). Na tej grupie 126 zawodników stworzony został kolejny model regresji liniowej.
Waga (kg) = -90,021 + 0,857 * wzrost (cm) + 0,36 * wiek (lata)
Wykres 3 ponownie przedstawia zależność wagi od wzrostu dla zawodników w wieku kolejno od najniższej linii 17, 22, 27, 32 i 37 lat. Jak widać zarówno ze wzoru matematycznego jak i wykresu, wśród najdroższych piłkarzy istnieje większa różnica optymalnej wagi z każdym kolejnym centymetrem wzrostu (857 gramów na 1 cm). Podobnie większy jest oszacowany przyrost wagi z wiekiem. Z każdym rokiem przeciętnie waga wzrasta o 0,36 kg, a więc ponad dwukrotnie więcej niż w modelu dla wszystkich zawodników. Wracając do przykładu 35-latka i 17-latka różnica wyniesie 18*0,36 kg = 6,48 kg. Ona jest już całkiem znacząca.
Pamiętajmy, że jest to duże uproszczenie tematu zależności między poziomem zawodnika a relacją wzrostu i wagi. Niemniej otwiera to pole do spekulacji, że nabierają więcej masy mięśniowej z czasem. Mogą też o tym świadczyć obserwacje zmiany sylwetek zawodników na przestrzeni czasu. Jeśli obejrzycie mecz z lat 70-80, zobaczycie bardzo szczupłych mężczyzn. Natomiast na obecnie rozgrywanych meczach dominują raczej atletycznie zbudowani piłkarze.
Porównanie modeli (wykres 4)
Wykres 4 przedstawia porównanie tych 3 modeli. Model drugi (zależności wagi od wzrostu i wieku) przedstawiony jest na niebiesko dla uśrednionego wieku 26,9 lat i dla tego wieku niewiele się różni od modelu 1. Współczynniki regresji zresztą również niewiele się różnią poza dodaniem wieku. Dlatego pomarańczowy wykres jest przykryty wykresem niebieskim. Inaczej prezentuje się wykres czarny dla zawodników najdroższych. Oczywiście należy pamiętać, że w zależności od wieku te wykresy będą przebiegać wyżej lub niżej. Tutaj jest przyjęty wiek średni.
Na wykresie 4. umieszczeni są ponadto różni najwybitniejsi zawodnicy (arbitralnie wybrani), ale pamiętajmy, że są w różnym wieku, więc można ich porównywać jedynie wobec modelu pomarańczowego (najprostszego – bez uwzględnienia wieku).
Przykład
Być może zadajesz sobie właśnie pytanie, co z tego wszystkiego wynika? To może spróbuję odpowiedzieć na swoim przykładzie. Otóż mam 182 cm wzrostu i 32 lata. Ile optymalnie powinienem ważyć, jeśli miałbym być piłkarzem?
Zacznę od istotniejszego wzoru (model 2):
Waga (kg) = -75,99 + 0,804 * 182 cm + 0,171 * 32 lata = 75,81 kg
Jeśli chciałbym poznać uniwersalną optymalną wagę przy swoim wzroście (niezależnie od wieku), to wykorzystuję model 1.:
Waga (kg) = -73,258 + 0,814 * 182 cm = 74,89 kg
Jeśli natomiast chciałbym się porównać z wybitnymi piłkarzami (z jakiegokolwiek powodu) korzystam z modelu 3.:
Waga (kg) = -90,021 + 0,857 * 182 cm + 0,36 * 32 lata = 77,47 kg
Jak daleko mi do ideału?
Cóż, nie da się ukryć, że moja waga odbiega znacznie od tych wartości (oczywiście wina pandemii :P). Zresztą waga każdego piłkarza w jakimś stopniu odbiega od tej wartości. Tabela 1 zawiera podsumowanie 2 pierwszych modeli pod względem różnicy między rzeczywistą wagą a wagą „optymalną” z punktu widzenia modelu. Próbujemy tutaj odpowiedzieć na następujące pytanie „jeśli ważę mniej lub więcej od wyliczonej wagi o np. 5 kg, to jaki % piłkarzy odbiega od tej modelowej wagi o maksymalnie te 5 kg?”. Statystycznie jest to wartość dystrybuanty wartości absolutnych błędów modelu.
Patrząc na tę tabelę możemy wyczytać, że dla obu modeli 5 kg to jest wartość znajdująca się pomiędzy 75% a 80%. Co to znaczy? To znaczy, że pomiędzy 75% a 80% piłkarzy ma swoją wagę bliżej wagi „optymalnej” niż 5 kg. Oznacza to, że większość zawodników jest relatywnie podobnej postury i może to świadczyć, że utrzymanie odpowiedniej masy ciała (nie zbyt niskiej, nie zbyt wysokiej) wpływa na sukces sportowy w tej dyscyplinie.
Część 2: pogłębiona analiza wagi i wzrostu piłkarzy
Czy pozycja na boisku ma znaczenie?
Oczywiście modele są wartościami uśrednionymi. Taki był ich cel, aby znaleźć uniwersalne relacje wagi i wzrostu (oraz wieku). Przy okazji jednak pokusiłem się o sprawdzenie bardziej piłkarskie, jak to wygląda ze względu na pozycję na boisku. Zobaczcie rozkłady wagi (wykres 5) i wzrostu (wykres 6) dla wszystkich piłkarzy z podziałem na pozycje.
Jeśli nie wiecie, jak je czytać, już w skrócie wyjaśniam: dla każdej pozycji („wiersze wykresu”) widać rozkład i tzw. box-plot (wykres pudełkowy):
– Czym bardziej w prawo jest ten wykres, tym wyższa przeciętna waga lub wzrost dla danej pozycji
– Czym bardziej płaski jest ten wykres, tym większe zróżnicowanie wagi lub wzrostu w grupie zawodników z danej pozycji
Jak widać – zgodnie zresztą z intuicją – najciężsi i najwyżsi są bramkarze, środkowi obrońcy i środkowi napastnicy. Do grona postawnych zawodników aspirują zdecydowanie defensywni pomocnicy. Na pozostałych pozycjach tj. w bocznych strefach i dla ofensywnych środkowych pomocników, waga i wzrost są przeciętnie niższe. Piłkarsko ma to uzasadnienie takie, że zawodnicy na tych pozycjach muszą być szybsi, zwinniejsi i bardziej technicznie zaawansowani. Różnice te potwierdzają odpowiednie testy statystyczne.
Dla wagi test równości średnich ANOVA (analiza wariancji) oraz jego nieparametryczny odpowiednik tj. test Kruskalla-Wallisa wykazały statystycznie istotną różnicę z ekstremalnie niskim p-value. Podobnie test Kruskalla-Wallisa dla wzrostu. ANOVA dla wzrostu nie została wykonana z uwagi na niespełnienie założeń testu o równości wariancji, co wykazał test Levene’a.
Wykres 7 pokazuje porównanie modeli regresji zrobionych dla poszczególnych pozycji. Jak widać w większości nachylenie wykresu jest bardzo zbliżone (od 703 g na 1 cm wzrostu dla bocznych obrońców do 849 g na 1 cm wzrostu dla bocznych pomocników, których jednak było zaledwie 32 w całej bazie piłkarzy). Główną różnicę stanowi przeciętny poziom wagi na różnych pozycjach. Dla jasności, po prawej stronie wykresu widać oszacowania modeli i tak np. dla środkowego obrońcy widzimy relację:
Waga (kg) = -57,47 + 0,732 * wzrost (cm)
Modele te nie uwzględniają wieku, więc są odpowiednikiem modelu 1. opisanego w części 1.
Przed zbudowaniem finalnego modelu z uwzględnieniem wzrostu porównane zostały w sposób analogiczny do pozycji modele dla 3 grup wiekowych:
- do 23 lat
- 24-30 lat
- powyżej 30 lat
Widać na nich pewne różnice, wskazujące na to, że starsi zawodnicy mogą się cechować przeciętnie większą wagą przy tym samym wzroście, co ostatecznie zostało wyliczone w modelu liniowym z uwzględnieniem wieku.
Podsumowanie
Niewątpliwie istnieje masa ciała, wokół której oscylują topowi piłkarza. Zależy ona, co oczywiste od wzrostu zawodnika. Duże ma znaczenie też wiek i pozycja na boisku. Co ważne wydaje się też, że najlepsi zawodnicy mają więcej masy mięśniowej niż ci przeciętniejsi.
Opis metodologii jest dostępny w postaci pliku PDF do pobrania.
Autorem tekstu jest Michał Miłkowski, który zawodowo zajmuje się statystyką i jest pasjonatem piłki nożnej. Owocem tego związku jest jego strona: O futbolu statystycznie