Sprawdzenie modelu — gdzie się myli i jak go poprawić

Bierzemy gole które piłkarze faktycznie strzelili w sezonie 25/26 i porównujemy z tym co model przewidywał. Sprawdzamy: gdzie był blisko, a gdzie się rozjechał. Z analizy wyrzucamy graczy, których z założenia nie dało się przewidzieć: kontuzjowanych (zagrali za mało meczów) i tych co przeszli latem do dużo mocniejszej ligi.

377graczy bierzemy do analizy
43odrzucamy (kontuzje, twarde transfery)
+25%o tyle model myli się dla typowego gracza

Model jest zachowawczy — typowy gracz strzela o 25% więcej goli niż przewidywaliśmy.

← lista 26/27 · prognoza 25/26 vs rzeczywistość · metodologia

Kogo wyrzuciliśmy z analizy i dlaczego

PowódLiczba graczyPrzykłady
przeszedł latem do dużo mocniejszej ligi21Kylian Mbappé, Evanilson, Kerem Aktürkoğlu, Jørgen Strand Larsen, Thierno Barry...
kontuzja (zagrał mniej niż 12 meczów w 25/26)22Alexander Isak, Romelu Lukaku, Emmanuel Emegha, Luuk de Jong, Dominik Fitz...

Dlaczego? Bo ich nie da się przewidzieć z samych danych statystycznych. Kontuzje są losowe, a po przejściu np. ze Sportingu do Arsenalu (Gyökeres) gracz musi się adaptować — to dla modelu inny świat. Po odrzuceniu zostaje 377 graczy dla których model miał uczciwą szansę trafić.

Co model bierze pod uwagę i czy ma rację

Model dla każdego gracza nakłada kilka korekt: za wiek, za status w klubie, za siłę zespołu, za transfer. Tu sprawdzamy każdą korektę z osobna: porównujemy „o ile model zmienia prognozę" z „o ile faktycznie zmieniło się tempo strzelania".

Status w klubie — czy gracz to starter, rotator, czy ławka

Sprawdzamy minuty z sezonu 24/25. Jeśli ktoś grał ≥75% możliwych minut to "starter". Jeśli 35-55% to "rotacja". Patrzymy czy korekta którą model robi dla każdej grupy ma sens.

GrupaIlu graczyCo model zakładaCo dane pokazująCo z tym zrobić
średnio grający (55-75% minut)144bez zmian+6% golimodel zaniża — ci gracze strzelają o ~6% więcej niż przewidujemy
pewny starter (≥75% minut)89+7% goli-6% golimodel zawyża — ci gracze strzelają o ~13% mniej niż przewidujemy
rotacja (35-55% minut)37-18% goli+7% golimodel zaniża — ci gracze strzelają o ~25% więcej niż przewidujemy
rezerwowy (20-35% minut)5-40% goli+149% goliza mało graczy w tej grupie żeby coś wnioskować

Wiek — jak rocznik wpływa na liczbę goli

Wiek liczony na sierpień 2025. Patrzymy czy nasza krzywa "starsi grają mniej" pasuje do rzeczywistości.

GrupaIlu graczyCo model zakładaCo dane pokazująCo z tym zrobić
26-2976bez zmian-5% goliOK — model dobrze trafia dla tej grupy
23-2561bez zmian-18% golimodel zawyża — ci gracze strzelają o ~18% mniej niż przewidujemy
≤2221+3% goli+4% goliOK — model dobrze trafia dla tej grupy
31-3218bez zmian+31% golimodel zaniża — ci gracze strzelają o ~31% więcej niż przewidujemy
33-3413-9% goli+23% golimodel zaniża — ci gracze strzelają o ~32% więcej niż przewidujemy
35+12-29% golibez zmianmodel zaniża — ci gracze strzelają o ~28% więcej niż przewidujemy
308bez zmian+22% goliza mało graczy w tej grupie żeby coś wnioskować

Siła klubu — mocny klub vs słaby klub

Mierzymy siłę klubu jako: ile xG (oczekiwanych goli) klub stwarza w porównaniu ze średnią ligi. Mocny klub = ≥1.15× średniej. Słaby = poniżej 0.85×. Sprawdzamy czy nasz boost/kara dla zawodnika z takiego zespołu jest na właściwym poziomie.

GrupaIlu graczyCo model zakładaCo dane pokazująCo z tym zrobić
mocny (≥1.15)124+34% goli+9% golimodel zawyża — ci gracze strzelają o ~25% mniej niż przewidujemy
dobry (1.0-1.15)73bez zmian+43% golimodel zaniża — ci gracze strzelają o ~41% więcej niż przewidujemy
słaby (<0.85)61-24% goli+33% golimodel zaniża — ci gracze strzelają o ~57% więcej niż przewidujemy
średni (0.85-1.0)22-7% goli-5% goliOK — model dobrze trafia dla tej grupy

Zmiana klubu na inną ligę

Czy gracz między 23/24 a 24/25 zmienił ligę? Jeśli tak — czy szedł do mocniejszej, słabszej, czy podobnej? Sprawdzamy czy model dobrze koryguje prognozę dla każdego kierunku.

GrupaIlu graczyCo model zakładaCo dane pokazująCo z tym zrobić
został w tej samej lidze250bez zmian+6% golimodel zaniża — ci gracze strzelają o ~6% więcej niż przewidujemy
zmienił ligę (siła podobna)12-6% golibez zmianOK — model dobrze trafia dla tej grupy
przeszedł do słabszej ligi7+19% goli-4% goliza mało graczy w tej grupie żeby coś wnioskować

Co po sezonie z dużą liczbą goli

Jeśli ktoś w 24/25 strzelił dużo więcej niż w poprzednich latach (≥8 goli ponad swoje typowe tempo), to model zakłada że kolejny sezon będzie słabszy ("powrót do średniej"). Sprawdzamy o ile słabszy faktycznie był.

GrupaIlu graczyCo model zakładaCo dane pokazująCo z tym zrobić
bez wybuchu246bez zmian+9% golimodel zaniża — ci gracze strzelają o ~9% więcej niż przewidujemy
wybuchowy sezon (8+ goli ponad zwykłe tempo)17-15% goli-56% golimodel zawyża — ci gracze strzelają o ~41% mniej niż przewidujemy
ekstremalny wybuch (12+ goli ponad)6-20% goli-39% goliza mało graczy w tej grupie żeby coś wnioskować

zielone — model trafia (różnica do 6 punktów procentowych) · żółte — lekkie odchylenie (do 15 pp) · czerwone — duży rozjazd (15 pp +)

Wszyscy gracze na jednym wykresie

Każda kropka to gracz. Im bliżej przerywanej linii, tym lepsza prognoza. Kropka nad linią = gracz strzelił więcej niż przewidywaliśmy. Kropka pod linią = strzelił mniej. Najedź kursorem żeby zobaczyć kto to.

00881616242432324040tu kropki by leżały gdyby model trafiał idealnieIle goli model przewidywałIle goli faktycznie strzelił
trafiony (różnica ≤ 3 gole) nietrafiony, ale w analizie wykluczony — kontuzja wykluczony — transfer do mocniejszej ligi

Największe pomyłki — gracze których model nie zrozumiał

To gracze z analizy — czyli ani kontuzjowani, ani po twardych transferach. Model miał wszystkie dane żeby trafić, a się rozjechał. To najlepsza lekcja co model jeszcze przeoczył. Czerwone wiersze = model przewidywał za dużo. Żółte = za mało.

GraczKlubModel przewidywałFaktycznie strzeliłRóżnicaCo model widział
Tolu ArokodareKRC Genk292.6+26.3mocny klub, Liga Europy, wybuchowy sezon 24/25, pewny starter
Viktor GyökeresSporting CP32.813.6+19.2mocny klub, Liga Mistrzów, karne floor +9.1, wybuchowy sezon 24/25
Mohamed SalahLiverpool266.9+19wiek 33, mocny klub, Liga Mistrzów, karne floor +6.8
Eldor ShomurodovRoma220.7-18.8Liga Europy, rezerwowy
Yoane WissaBrentford19.71.2+18.5mocny klub, wybuchowy sezon 24/25, pewny starter
Vedat MuriqiMallorca7.725.7-18karne floor +2.3
Mauro IcardiGalatasaray0.417.7-17.4mocny klub, Liga Mistrzów, głęboka ławka
Tawanda MaswanhiseMotherwell2.719.6-16.8rotacja
Anders DreyerRSC Anderlecht1.117.7-16.6Liga Europy, rotacja
Esteban LepaulAngers2.318.1-15.9rotacja
Jesús RamírezVitória SC1.317-15.7rezerwowy
Chris BediaBSC Young Boys2.117.5-15.4Liga Europy, rezerwowy
Ayase UedaFeyenoord10.826.1-15.3mocny klub, Liga Mistrzów, rotacja
Victor OsimhenGalatasaray30.515.2+15.3mocny klub, Liga Mistrzów, karne floor +4.6, transfer do słabszej ligi(+13%)
Serhou GuirassyBorussia Dortmund30.915.9+15.1mocny klub, Liga Mistrzów, karne floor +3.0, pewny starter
Yanis BegraouiEstoril Praia6.621.5-14.9mocny klub
Rodrigo ZalazarSporting Braga2.317-14.7Liga Europy, rotacja
Valentín CastellanosLazio19.24.6+14.6mocny klub, karne floor +2.3
Rafa SilvaBeşiktaş JK23.58.9+14.6mocny klub, Liga Europy, zmiana ligi, pewny starter
Tomáš BobčekKS Lechia Gdańsk3.217.6-14.4rotacja
Pedro GonçalvesSporting CP0.914.7-13.8mocny klub, Liga Mistrzów, rezerwowy
Franjo IvanovićRoyale Union Saint-Gilloise17.13.5+13.5mocny klub, Liga Mistrzów, karne floor +3.0, pewny starter
Marcos LeonardoBenfica0.213.6-13.4mocny klub, Liga Mistrzów, głęboka ławka
Joshua KingToulouse2.815.9-13.1wiek 33, rotacja
Loïs OpendaRB Leipzig14.21.1+13.1pewny starter

Co z tego wynika dla naszego modelu

  • Mocne kluby — model za bardzo podbija prognozę. Dla zawodników mocnych klubów (Bayern, City, Madryt) model zakłada +34% goli, a dane mówią +9%. Sam fakt grania w gigancie nie sprawia że strzelasz dużo więcej — gigant ma więcej napastników którzy się dzielą bramkami.
  • Sezon z gradem goli rzadko się powtarza — i to bardziej niż zakładamy. Jeśli ktoś w 24/25 strzelił 8+ goli ponad swoje typowe tempo, model obniża prognozę o 15%, ale dane mówią że powinniśmy obniżyć o 56%. Powtarzanie świetnego sezonu to wyjątek, nie reguła.
  • Przejście do słabszej ligi nie daje boostu którego się spodziewamy. Model dodaje +20% goli, dane mówią 0%. Adaptacja do nowego klubu zjada to co miało być zyskiem ze słabszej obrony przeciwników.
  • Karzemy wiek 30+ za mocno. Dla 33-34 lat model obniża o 9%, a dane pokazują że tacy gracze faktycznie strzelają o 23% więcej. To trochę „bias przeżycia" (starsi którzy nadal grają to elita), ale i tak sygnał że nie powinniśmy każdego po trzydziestce automatycznie spisywać.
  • Status w klubie ma mniejszy wpływ niż myślimy. Pewni starterzy są lekko przeszacowani, rotatorzy lekko niedoszacowani — obie grupy zbiegają się do prognozy ±. Może warto spłaszczyć tę korektę.

Uwaga: niektóre grupy mają mało graczy (np. po wybuchowym sezonie tylko 17 osób). Wnioski są kierunkowe — pokazują gdzie iść, ale nie są wyrocznią. Dlatego warto je traktować jako hipotezy do sprawdzenia, a nie pewniki.