spacer
     

La misurazione di un'ingiustizia

Parla in libertà di argomenti di carattere generale attinenti il Bari: partite, allenamenti, calciomercato. Prima di aprire un nuovo topic, controlla sempre se l'argomento è già stato trattato!

Moderatori: u'mang, Greem, Rosencratz, divin gallo, Soloesemprebari, Pino, il_colonnello, sirius

rejkjavik

Avatar utente
Fedelissimo
Fedelissimo
 
Messaggi: 2528
Iscritto il: gio gen 23, 2003 1:33
Località: Milano (BA)
Highscores: 0

Re: La misurazione di un'ingiustizia

Messaggioda rejkjavik » mer mag 20, 2020 8:12


BariCatanzaro1972 ha scritto:
rejkjavik ha scritto:Fatelo girare, messo su YouTube
https://youtu.be/sPn43t5WuTI

Complimenti a te o non so a chi, il tuo ragionamento non fa una piega da un punto di vista matematico e distrugge quel criterio. Tuttavia quel criterio è già stato adottato e, ahimé un precedente è un precedente, e non la vinci facilmente...il punto su cui va focalizzata la situazione è che u precedente a questa situazione non c'è visto che i campionati non si sono conclusi e che ognuno ha disputato diverse e non pari partite tra casa e fuori, tra noi e il carpi c'è un delta di 4. In tal modo quel criterio è ancora più assurdo e alla situazione attuale non c'è un precedente....


Esattamente!

oasistom

Avatar utente
Fedelissimo
Fedelissimo
 
Messaggi: 3929
Iscritto il: dom feb 23, 2003 2:24
Località: Bari
Highscores: 0

Re: La misurazione di un'ingiustizia

Messaggioda oasistom » mer mag 20, 2020 22:23


rejkjavik ha scritto:Per l'angolo dello statistico, dopo una più attenta analisi dei numeri, ecco tre grafici che comprovano come il calcolo della media aritmetica operato da Lega Pro non abbia - nel nostro caso - fondamento scientifico, e come si allontani (forse inconsapevolmente) dal criterio di merito sportivo sancito dall'UEFA.com stessa come cardine per stabilire promozioni e accessi a competizioni europee. Potremmo intitolare questo post "La misurazione di un'ingiustizia". Sperando che la FIGC Federazione Italiana Giuoco Calcio possa porre rimedio.

La Lega Pro sostiene di aver adottato un criterio per stabilire una proiezione di punti alla trentesima giornata, per quelle squadre che hanno disputato un numero inferiore di partite. Il criterio adottato risponde alla #proporzione tra punti e giornate giocate, #rapportata a 30 (il numero di giornate effettive giocate dal SSC Bari, squadra che tra le tre in lizza ne ha disputate di più).

Es. il Carpi F.C. 1909 ha totalizzato 53 punti in 26 partite. Rapportandoli alle 30 partite giocate dal Bari, in base alla proporzione alla giornata 30, quei punti sarebbero stati 61,15, quindi più di quelli del Bari che ne ha fatti 60 sul campo.
E' importante sottolineare che il confronto qui avviene tra una proiezione (di per sé aleatoria) e i punti effettivi del Bari e si regge su un'importante ipotesi: che la #media dei risultati fin qui tenuta da tutte le squadre abbia il 100% di possibilità di mantenersi tale anche nelle gare non disputate.

Questa forte ipotesi è stata molto utile in passato per confrontare, a fine stagione, le performance di squadre che - avendo disputato la totalità dei loro incontri in gironi di differenti dimensioni o con squadre ritirate - venivano così ricondotte ad un unico indicatore sintetico, perfettamente confrontabile ed equo. E' questo ad esempio il principio che nel 2017 consentì al Modena F.C. 2018 (a fine stagione) di paragonare la propria media con successo rispetto a quella di squadre di altri gironi. In quel caso il Modena e le duellanti del girone C avevano disputato la stessa percentuale di partite ma in gironi di dimensioni diverse. Un po' come se io avessi voluto confrontare lo scorso anno le performance del Bari di D (campionato a 18 squadre) e la Juve di A (campionato a 20 squadre). In quel caso nulla da eccepire. Tutti hanno giocato tutte le loro partite a disposizione. Il criterio c'è, storicamente valido e utilizzato.

Peccato che qui ci troviamo in una situazione molto diversa in quanto: i gironi, pur avendo uno stesso numero di partecipanti, non si sono completati, e ogni squadra ha perciò un valore di "attendibilità" del proprio score che è differente rispetto alla totalità delle partite. Il Bari parte da un risultato acquisito al 79%, il Carpi al 68%, la Reggio Audace F.C. al 71%. Di questo nessuno ha merito, nessuno ha demerito. E' un fatto.

Al fine di eliminare questa distorsione, l'applicazione di una media aritmetica semplice non può bastare, in quanto non terrebbe conto dei diversi pesi specifici dei risultati ottenuti sul campo.

Allo stesso tempo non può costituire un vantaggio l'aver disputato più partite, andando a vanificare la possibilità per le altre di affermare che, se avessero giocato, avrebbero probabilmente ottenuto una performance migliore.

Per questo motivo, usando la logica, prima ancora che la statistica, possiamo affermare che sono iniqui sia il criterio della c.d. media ponderata, vale a dire un coefficiente che stima a 0% la possibilità per chi non ha giocato di mantenere la sua media punti nelle giornate successive, sia la c.d. media semplice, che stima al 100% la possibilità per chi non ha giocato di mantenere la sua media punti nelle giornate successive (eventualmente usabile solo a completamento effettivo di un girone, ancorché dimensionato in modo differente).
L'unico criterio valido è la valutazione di tutti i casi intermedi tra questi due estremi, e l'analisi di diversi scenari probabilistici che si sarebbero potuti verificare se le squadre con meno partite avessero avuto la possibilità di giocare sul campo le loro partite e difendere la loro media punti.

Questo è quello che ho analizzato nelle seguenti tabelle, da cui emerge inequivocabilmente che - assodato che in 30 giornate il Bari ha meritato una media punti di 2 a partita, (1,579 se rapportati alla totalità di 38 partite), è questo 1,579 il coefficiente che dovremo confrontare rispetto alle altre, andando a stimare la probabilità che Carpi e Reggio Audace avrebbero potuto almeno eguagliarlo giocando le 3 o 4 partite mancanti.

Ebbene, calcolando tutti gli scenari probabilistici (posso condividere il file Excel con chiunque lo desideri) arriviamo alla conclusione che il Bari avrebbe una media migliore e non raggiungibile dalle altre due squadre nell'81% dei casi.
Nel restante 18%: la media del Bari potrebbe essere superata nel 17% dei casi dalla Reggio Audace, e nell'1% dei casi dal Carpi.
Avete capito bene. Il Carpi vince in questo "gioco" solo sotto la considerazione del potere mantenere con la quasi matematica certezza la stessa media ottenuta sul campo anche nelle partite frutto di proiezione aleatoria, un caso che probabilisticamente si verifica solo nell'1% delle possibilità (raggiungimento della soglia di certezza del 99%).

La Reggio Audace vincerebbe se fosse in grado di mantenere la stessa media con una certezza compresa fra l'82% e il 99%, vale a dire nel 17% delle possibilità.
Qui sotto potete vedere due simulazioni differenti di "casi a caso".
Il primo grafico, già mostrato ieri, ma ricorretto facendo meglio i calcoli, si basa sulla regola della probabilità combinata aleatoria. E stima qual è il grado di possibilità in base al caso (stile sorteggio) che Carpi e Reggiana riescano a ottenere i risultati a loro utili per mantenere la loro stessa media, rispettivamente nelle eventuali 4 e 3 partite che avrebbero dovuto disputare per poter raffrontare la loro media con quella del Bari. Sono valori oggettivamente bassi, che rispondono al detto caro a mio papà "la palla è rotonda". Considerano perciò la vittoria come possibile nel 33% dei casi, così come il pari o una sconfitta.

Volendo essere più accurati, possiamo andare a sostituire al principio della probabilità aleatoria quello della probabilità su base storica, che tiene in considerazione l'attuale percentuale di vittorie, pareggi e sconfitte ottenute dalle tre squadre. In tal caso noteremmo che il Carpi, sulla base del suo storico, si avvicinerebbe molto alla soglia dell'81% (79%), soglia a cui però è ancora molto lontano da poter impensierire il Bari (per poterlo battere quel valore dovrebbe essere almeno 99%). Si avvicina anche la Reggiana, con un valore di 68% (vicina, ma sotto l'81%).
Questo è spiegato dettagliatamente nella seconda tabella. Per gli altri amici statistici, volutamente io tengo conto di tutte le partite, senza distinzione tra casa e trasferta. Avessimo considerato le sole trasferte, avendo il Bari 4 gare in trasferta in più del Carpi, la soglia sarebbe stata ben inferiore, rendendo ancora meno probabile la confrontabilità tra le medie delle due squadre biancorosse.

Mi si opporrà: perché in Francia si è adottato il criterio di mediare tutti i punti? La mia risposta, che certamente meriterebbe ulteriore approfondimento, è che quando la variazione di giornate è pari a 1 è statisticamente molto più facile per una squadra conservarsi con una media migliore dell'avversaria con una partita in più anche in caso di sconfitta. Vale a dire che ci sarebbe la matematica certezza (con il 100% delle possibilità, o con qualsiasi tipo di risultato) che i valori espressi dalle medie delle partite realmente giocate equivalgano a quelli esito della proiezione su una giornata in più. Pertanto il criterio può ritenersi valido. L'aumento oltre 1 giornata invece, fa diventare preponderante l'aleatorietà, in un modo che da un lato è ineliminabile, dall'altro sarebbe un colossale imbroglio non considerare affatto.



Lo hai girato a quel demente di Ghirelli?
Sempre e un solo grido Forza Bari

Precedente

Torna a LA BARI

Chi c’è in linea

Visitano il forum: Google Adsense [Bot], Xavier e 120 ospiti