sabato 16 gennaio 2016

Scarti 5000-10000m: gli atleti world class


   Riprendiamo il discorso sullo scarto di passo 5000-10000; ricordo che la "letteratura ufficiale" in genere indica scarti in sec/km crescenti al crescere dei tempi di percorrenza (ovvero al decrescere del livello dell'atleta) mentre la "letteratura corsara" non concorda con quest'opinione.
   Vediamo cosa ne pensa Jack Daniels, l'autore famoso che forse più si avvicina alle mie posizioni:

5000 in 12.37 - 10000 in 26.19
5000 in 12.45 - 10000 in 26.34
5000 in 12.53 - 10000 in 26.51
5000 in 13.01 - 10000 in 27.07 (2'42.7 - 2'36.2 = 6.5)
5000 in 13.09 - 10000 in 27.24
5000 in 13.18 - 10000 in 27.41
5000 in 13.26 - 10000 in 27.59
5000 in 13.35 - 10000 in 28.17
5000 in 13.44 - 10000 in 28.36
5000 in 13.54 - 10000 in 28.55
5000 in 14.03 - 10000 in 29.14 (2'55.4 - 2'48.6 = 6.8)
5000 in 14.13 - 10000 in 29.34
5000 in 14.18 - 10000 in 29.44
5000 in 14.23 - 10000 in 29.55
5000 in 14.33 - 10000 in 30.16
5000 in 14.49 - 10000 in 30.49
5000 in 15.06 - 10000 in 31.23 (3'08.3 - 3'01.2 = 7.1)
5000 in 15.18 - 10000 in 31.46
5000 in 15.29 - 10000 in 32.11
5000 in 15.42 - 10000 in 32.35
5000 in 15.54 - 10000 in 33.01
5000 in 16.07 - 10000 in 33.28 (3'20.8 - 3'13.4 = 7.4)

   Quindi secondo Daniels ci sarebbe un lieve aumento dello scarto, comunque molto meno che proporzionale al peggioramento della prestazione (13.8% contro 27.3%).
   Altre eminenze (Letessier, Gardner, Purdy, Pizzolato) concordano sul fatto che lo scarto, a livelli top, sarebbe 6 per poi aumentare progressivamente (anche di brutto). Ma ste eminenze da dove li prendono i numeri? Sanno esattamente di cosa stanno parlando?

   Ebbene, io i numeri li prendo dalle liste all-time IAAF. Ho preso i primi 20 diecimilisti che hanno anche tempi sui 5000m e ho calcolato passi e scarti... ma ho preso pure i primi 20 cinquemilisti che hanno anche tempi sui 10000m... e vediamo che ci sono delle sorprese:

26:17.53 Kenenisa Bekele 12:37.35 (2'38 - 2'31 - 7)
26:22.75 Haile Gebrselassie 12:39.36 (2'38 - 2'32 - 6)
26:27.85 Paul Tergat 12:49.87 (2'39 - 2'34 - 5)
26:30.03 Nicholas Kemboi 13.01.14 (2'39 - 2'36 - 3)
26:30.74 Abebe Dinkesa 12:55.58 (2'39 - 2'35 - 4)
26:35.63 Micah Kogo 13:00.77 (2'39 - 2'36 - 3)
26:36.26 Paul Koech 12:56.29 (2'40 - 2'35 - 5)
26:37.25 Zersenay Tadese 12:59.27 (2'40 - 2'36 - 4)
26:38.08 Salah Hissou 12:50.80 (2'40 - 2'34 - 6)
26:38.76 Abdullah Ahmad Hassan 13:04.65 (2'40 - 2'37 - 3)
26:39.69 Sileshi Sihine 12:47.04 (2'40 - 2'33 - 7)
26:39.77 Boniface Kiprop 12:57.11 (2'40 - 2'35 - 5)
26:41.75 Samuel Wanjiru 13.12.40 (2'40 - 2'38 - 2)
26:43.98 Lucas Rotich 12:55.06 (2'40 - 2'35 - 5)
26:44.36 Galen Rupp 12:58.90 (2'40 - 2'36 - 6)
26:46.57 Mohamed Farah 12:53.11 (2'41 - 2'35 - 6)
26:48.35 Imane Merga 12:53.58 (2'41 - 2'35 - 6)
26:48.99 Josphat Bett 12:57.43 (2'41 - 2'35 - 6)
26:49.02 Eliud Kipchoge 12:46.53 (2'41 - 2'33 - 8)
26:49.20 Moses Masai 12:50.55 (2'41 - 2'34 - 7)
media 5.3



12:37.35 Kenenisa Bekele 26:17.53 (2'38 - 2'31 - 7)
12:39.36 Haile Gebrselassie 26:22.75 (2'38 - 2'32 - 6)
12:39.74 Daniel Komen 27:38.32 (2'46 - 2'32 - 14)
12:46.53 Eliud Kipchoge 26:49.02 (2'41 - 2'33 - 8)
12:46.81 Dejene Gebremeskel 26:51.02 (2'41 - 2'33 - 8)
12:47.04 Sileshi Sihine 26:39.69 (2'40 - 2'33 - 7)
12:47.53 Hagos Gebrhiwet 27.57 (2'48 - 2'33 - 15)
12:48.64 Isiah Koech 27:17.03 (2'44 - 2'34 - 10)
12:48.66 Issac Songok 28'46 (2'53 - 2'34 - 19)
12:48.77 Yenew Alamirew 28.34 (2'51 - 2'34 - 17)
12:48.81 Stephen Cherono 28.05 (2'48 - 2'34 - 14)
12:49.04 Thomas Longosiwa 28.11.30 (2'49 - 2'34 - 15)
12:49.28 Brahim Lahlafi 27.43.05 (2'46 - 2'34 - 12)
12:49.50 John Kipkoech 28.48 (2'53 - 2'34 - 19)
12:49.71 Mohammed Mourhit 26:52.30 (2'41 - 2'34 - 7)
12:49.87 Paul Tergat 26:27.85 (2'39 - 2'34 - 5)
12:50.24 Hicham El Guerrouj ???
12:50.25 Abderrahim Goumri 27:02.62 (2'42 - 2'34 - 8)
12:50.55 Moses Masai 26:49.20 (2'41 - 2'34 - 7)
12:50.72 Moses Kipsiro 27:04.48 (2'42 - 2'34 - 8)
12:50.80 Salah Hissou 26:38.08 (2'40 - 2'34 - 6)
media 10.6

media generale su 40 atleti: 7.9


   Quindi dobbiamo concludere che:

- gli atleti più 10000isti che 5000isti hanno mediamente uno scarto un po' inferiore rispetto a ciò che dice la letteratura
- gli atleti più 5000isti che 10000isti hanno mediamente uno scarto molto superiore rispetto a ciò che dice la letteratura
- c'è qualche motivo per cui dovremmo dare più importanza ai primi che ai secondi? No, per cui ha senso calcolare la media generale dei 40 atleti e questa è significativamente MAGGIORE (7.9 contro 6) rispetto a ciò che dice la letteratura. Ergo, non è vero che i top scartano 6.
- ma allora ste eminenze letterarie di che minkia parlano???

   Allora, la prima parte della teoria letteraria ("gli atleti top scartano 6") è falsa. Poi vedremo altre sorpresine riguardanti gli atleti di livello amatoriale-master, per verificare se la seconda parte della teoria letteraria ("lo scarto in sec/km aumenta al peggiorare delle prestazioni") è vera.



40 commenti:

  1. Non bisogna dare più importanza ai primi che ai secondi, bisogna dare importanza solo a quelli più attendibili, cioè a quelli che con una certa sicurezza si sono "impegnati" allo stesso modo sulle due distanze.
    Non puoi considerare il povero Wanjiru che era un maratoneta e non penso si sia svenato a fare 13'12" sui 5k. Daniel Komen grandissimo talento (forse il più grande) ma non ha mai fatto seriamente un 10k. Idem Stephen Cherono. Gente con stesso tempo di Tergat sui 5.000 non è credibile che poi prendano 10 o più secondi a km sui 10.000, semplicemente non hanno tirato la gara, però sulle statistiche incidono molto nella media.
    Prendi invece quelli che han fatto con impegno entrambe le distanze e scartano tutti intorno ai 6, secondo più secondo meno.
    Zedemel

    RispondiElimina
    Risposte
    1. il "coefficiente impegno" è soggettivo e non rilevabile statisticamente per tutti. bisogna attenersi ai numeri, altrimenti dovremmo inserire anche il "coefficiente clima" e tanti altri... allora le statistiche sarebbero impossibili e ognuno potrebbe portare avanti qualsiasi teoria.
      non mi pare che daniels si attenga ai numeri perfettamente (ma molto meglio di altri...).
      fra quelli con scarti strani c'è pure qualcuno che s'è impegnato ma non era portato per quella distanza o non era quella la distanza maggiormente finalizzata.

      Elimina
  2. Se domani...inseriamo il coefficiente impegno. Semplicemente Jack ha fatto un enorme raccolta di dati e li ha elaborati in maniera statistica...quello che fa il corsaro e che fanno tanti altri che magari ancora non hanno scritto libri. I master possono scattare uguale, la differenza lì la fa non l'impegno ma il tempo per allenarsi bene per ogni distanza e il kmetraggio. Ma si può affermare che gli scarti sono quelli.

    RispondiElimina
    Risposte
    1. io sospetto che daniels abbia raccolto dati solo sui 10000isti e si sia scordato dei 5000isti...

      Elimina
    2. Io ho parte del suo database e il file Excel con tutti gli algoritmi e ti posso dire che ha fatto una raccolta molto accurata e ha spaziato su tutti...però nel dettaglio se ha raccolto più 10isti che 5isti questo non si riesce a valutare perché i numeri sono enormi

      Elimina
  3. Per quanto riguarda Pizzolato non saprei perchè non ho letto niente di suo, ma riguardo a Daniels le sue tabelle di equivalenze secondo me hanno un significato diverso: cercano di stabilire l'equivalenza di due prestazioni su diverse distanze (quindi non direttamente confrontabili).
    Quindi non è detto che un'atleta che raggiunge una prestazione su una distanza è automaticamente in grado di raggiungere la stessa prestazione su altre distanze. Ovviamente poi è più facile riuscirci su distanze vicine (5k e 10k) che su distanze lontane (5k e maratona).
    Sul fronte statistico, io più che analizzare gli scarti fra due prestazioni dello stesso atleta, proverei a raccogliere le migliori k prestazioni per ogni distanza (con k molto molto grande) e poi userei i percentili per trovare le equivalenze. Sarebbe interessante anche vedere se e come le cose sono cambiate negli anni e anche se e come le cose cambiano con l'età dell'atleta....

    RispondiElimina
    Risposte
    1. sarebbe interessante... ma il tempo è poco e non mi paga nessuno :)

      Elimina
  4. Edoardo EastLondoner17 gennaio 2016 alle ore 11:41

    Suggerimento: aumenta il campione, escludi gli atleti contati 2 volte (se non l'hai già fatto), e calcola l'intervallo di confidenza al 95%. A questo punto, chissenefrega della letteratura! Anzi, a questo punto puoi pensare di pubblicare tu su una rivista scientifica, e diventi tu la letteratura

    RispondiElimina
  5. Bisogna attenersi ai numeri, ma i numeri vanno analizzati togliendo gli scarti in eccesso e in difetto. Se tra questi prendi chi ha corso un elevato numero sia di 5000 che di 10000, la media tornerà a essere attorno ai 6 (poi non stiamo a spaccare il secondo), perché tante gare diventa più probabile aver corso almeno una volta in condizioni ideali entrambe le distanze.
    Gente che fa 12'48", 28'30-28'40" poi non è credibile.
    Ho guardato a caso john kipcoech, fa 2'53"/km sui 10.000, 2'34"/km sui 5.000 e... ha fatto la mezza a 2'55"/km... su dai :-) però quel 19 di scarto incide molto sulla media.
    Zedemel

    RispondiElimina
    Risposte
    1. Edoardo EastLondoner17 gennaio 2016 alle ore 12:23

      Appunto per non avere questi problemi bisogna ampliare il campione e vedere lo scarto con intervallo di confidenza del 95%. A questo punto, si vede se lo scarto è piccolo, e, se così fosse, risolveremmo il problema una Volta per tutte. In sostaza,vogliamo sapere la media, e il range in cui si può ricadere nel 95% dei casi. Ad esempio, media di 8 secondi con uno scarto di 1 secondo nel 95% dei casi.

      Elimina
    2. E poi se uno analizza i supertop mondiali, ne può conoscere anche la storia atletica, vedi Komen.
      Zedemel

      Elimina
    3. Edoardo EastLondoner17 gennaio 2016 alle ore 14:37

      Esatto! Se il campione è sufficientemente ampio, possiamo sorvolare le eccezioni!

      Elimina
    4. zedemel,
      sì, però non puoi eliminare solo gli scarti assurdi che piacciono a te (per comprovare che la media è 6 e che quindi hanno ragione le eminenze).
      allora dovremmo eliminare anche kemboi, tadese, dinkesa, hassan, wanjiru che i 5000 l'hanno fatti pe' gioca'...

      Elimina
    5. Infatti andrebbero tolti pure loro e la media diventa ancora di più 6 :-)))
      Anche se 4 è un po meno fuori scala di 19.
      Comunque si può dire che sulla tabellina messa l'uomo del whisky ha fatto un buon lavoro :-)
      Zedemel

      Elimina
    6. non concordo con questo "metti e togli" soggettivo.
      daniels spiega esattamente come ha raccolto i dati? perchè NON CONCORDANO coi dati iaaf.

      Elimina
    7. guardando la tabella non concorda coi dati iaaf..... coi top 20 iaaf. E' più probabile che abbia preso tutti i tempi dei vari atleti, o di chi ha almeno un tot di gare sia sui 5000 che sui 10000.
      Zedemel

      Elimina
    8. mi pare di capire che non è chiaro come daniels (o altri) facciano sti calcoli.
      come li ho fatti io E' CHIARO.

      p.s. anche togliendo i 5 casi più "strani" da entrambe le liste, si ottiene una media generale sui 30 atleti di 7.2.
      che non è 6...

      Elimina
    9. Prova a contattarlo in qualche modo, non penso abbia problemi a dire che dati ha preso, se invece evade, vuol dire che li ha fatti a capocchia sua :-D
      Zedemel

      Elimina
    10. provate a chedere invece a pizzolato...

      Elimina
    11. Io do ragione a zedemel
      Elaborate statistiche poco attendibili

      Elimina
  6. Luc, quanto si scarta mediamente tra 10k e 15k? Graziasss

    RispondiElimina
  7. Risposte
    1. scarto 10.
      ma basta vedere il tuo scarto 10-21 (6) per capire che il tuo 10000 non è affatto ottimizzato.

      Elimina
  8. corsaro ti ho spedito,fammi sapere se ti e^ arrivato tutto betty cjorben

    RispondiElimina
  9. salve corsaro; intanto mi presento, visto che sono al primo commento: sono un mezzofondista master m45 che in passato, per ragioni di studio, ha avuto a che fare con un pò di statistica. Siccome la questione mi intrigava, ho provato a fare io un lavoretto sui dati (oh, a me giocare coi numeri continua a piacermi...ognuno ha le sue fisse).
    Ho preso le liste all time dei 10.000 e dei 5.000 dal sito della IAAF, con tutti i risultati disponibili (sono 217 per i 10.000 e 285 per i 5.000, chissà perchè...), ho estratto gli atleti presenti in entrambe le liste (che sono 122) e fatto due conti. Ecco in sintesi i risultati: media generale degli scarti 5k-10k = 6"32, con deviazione standard = 1"40 e limiti di confidenza della media al 95% rispettivamente a 3"52 (cl inferiore) e a 9"13 (cl superiore). Dalla distribuzione di frequenza degli scarti si vede che: il 34,4% del campione scarta fra 6 e 7", il 19,7% fra 7 e 8" e il 17,2% fra 5 e 6"; nel complesso, quindi il 71% scarta fra 5 e 8".
    Mi sono limitato, per ora, agli atleti presenti in entrambe le liste; per un lavoro statisticamente più robusto, sarebbe interessante recuperare i PB degli atleti presenti in una sola lista (voglio dire, i PB sui 5000 di quelli che sono nella lista dei 10000 ma non in quella dei 5000, e viceversa); il fatto che le liste disponibili sul sito siano "troncate" a un progressivo diverso (a 217 per i 10k e a 285 per i 5k) potrebbe anche comportare qualche differenza sulle statistiche descrittive.
    Se ti può interessare ti mando via mail il foglio elettronico con i calcoli...

    RispondiElimina
    Risposte
    1. comunque io qui volevo proprio analizzare solo i primissimi, per vedere se lo scarto di questi era 6 (per poi crescere...) come dicono certi "scienziati".

      Elimina
  10. addendum: ho provato a fare la distinzione che ha fatto anche il corsaro, cioè a vedere come vatia la media degli scarti fra i "più cinquemilisti", e i "più diecimilisti". Non avendo alcun metodo oggettivo, ho assegnato gli atleti all'uno o all'altro gruppo in base al fatto che si trovino più in alto nelle liste dei 5 o dei 10k; Gebresilasie e Bekele, che sono secondo e primo in tutte e .due le liste, li ho inclusi in entrambi i gruppi. Ecco o risultati:
    - i "più 5milisti" hanno: media 7"82, deviazione standard 0"86 e limiti di confidenza al 95% a 6"11 e 9"54;
    - i "più 10milisti" hanno: media 5"68, deviazione standard 5"04, limti di confidenza al 95% a 3"61 e 7"76.
    Perciò, almeno su questo campione, esiste una differenza significativa fra gli scarti medi dei due gruppi, in linea con quanto calcolato sui primi 20delle liste dal Corsaro.
    Insomma, da quello che torna a me, c'avete ragione sia tu (gli scarti degli specialisti dei 5k sono più alti della media generale e significatvamente più alti di quelli degli specialisti dei 10k) sia Daniels (la media generale è fra 6 e 7"). ;)

    RispondiElimina
    Risposte
    1. ciao lociomuto!
      grazie dell'intervento, hai fatto un buon lavoro, se vuoi mandarmelo via mail è ben accetto.
      1) domanda: se gli scarti medi dei più 5isti e più 10isti sono 7.82 e 5.68, la media generale dovrebbe essere 6.75... perchè invece riporti 6.34?
      2) nei miei calcoli, per 5 atleti più 5isti, ho riportato i loro tempi sui 10km su strada, non avevano tempi sui 10 in pista. questo è un grosso problema, 10000 in pista ormai se ne corrono pochi.
      ma anche volendo eliminare dai calcoli questi 5, la media su 35 atleti viene 7.2.
      se a te la media viene 6.34 (o 6.75) e nei calcoli hai aggiunto atleti meno forti dei miei, allora vuol dire che quelli meno forti scartano MENO di quelli più forti!
      3) la mia guerra non è contro daniels (in finale i miei dati si scostano poco dai suoi) ma contro quelli che calcolano in % e quindi sostengono che lo scarto aumenta proporzionalmente ai tempi, mentre per me gente che va a 4'30 scarta uguale a gente che va a 2'40.
      ma fare statistiche precise su chi va a 4'30 è molto difficile, parliamo di amatori, pochi di questi fanno pista... e parliamo di amatori di basso livello i cui dati non trovi da nessuna parte.

      Elimina
    2. Si certo
      A 2'40 si va a 22.5km/h
      A 4'30 a 13 e qualcosa
      Scartare 7" al km a 4'30 è impossibile per il 95% degli amatori che corrano seriamente le 2 distanze
      Mentre a 2'40 il 60% riesce a farlo
      Sempre a discutere degli estremi per tirare acqua al proprio mulino

      Elimina
    3. Ciao Corsaro, provo a risponderti.
      Per il punto 1): la media delle medie di due gruppi è uguale alla media generale solo se i due gruppi contengono lo stesso numero di osservazioni. Nella mia lista, fra i 122 casi che avevo il gruppo dei "più 5k" era di circa 40 casi, e quello dei "più 10k" era di circa 80; è per quello che non puoi calcolare la media generale come media delle medie dei due gruppi.
      punto 2): come vedi da quanto scritto al punto 1), nella lista IAAF dei 5k ci sono molti atleti che non hanno risultati in quella dei 10k (un esempio per tutti: Daniel Komen, il suo PB sui 10k è oltre la posizione 217, l'ultimo dato della lista IAAF dei 10k). E questo è un grosso limite del campione che ho considerato, e che potrebbe anche distorcere un pò i risultati. Bisognerebbe recuperare i risultati sui 10k per tutti (o almeno quasi) quelli della lista dei 5k e viceversa... un lavoraccio, ma questo lo sai visto che tu per i primi 20 lo hai fatto! Il tempo è quello che è...
      3) hai ragione, già non è semplice avere abbastanza dati per gli atleti elite. Beh, a avere MOLTO tempo a disposizione uno si potrebbe mettere a spulciare le liste master, considerando anche i 10.000 su strada... ma è un lavoro immane!
      Comunque appena posso ti mando il file, magari ci aggiungo gli atleti che mi mancano dalle tue liste qua sopra, tipo Komen, e vediamo cosa cambia.

      OT: già che sono qui, visto che ti ho "rubato" qualche allenamento, tipo gli event run lunghi del post su Walter, colgo l'occasione per ringraziarti delle esperienze che condividi. Mi ci sto proprio divertendo, vedremo se con me danno gli stessi frutti ; )

      Elimina
    4. Infatti Komen è emblematico, potenzialmente il più forte di sempre, 27'38", ti pare potesse andar più piano di un Meucci? :-)
      Andrebbe presa una lista di persone che ha fatto con costanza soprattutto 5000 e 10000 (ad es. Farah, Rupp, Gebre etc.) E fare l analisi, e lo scarto sarebbe intorno ai 6. Lo so che le statistiche prendono tutti i numeri, ma queste son persone e certe condizioni van messe.
      Zedemel

      Elimina
    5. @...
      In realtà come ha già scritto qualcuno devi vederla da un altro punti di vista, chi va da 2'40 a 2'33" in realtà guadagna molta più velocità di chi passa da 4'30 a 4'23" pur dimezzando la distanza.
      Zedemel

      Elimina
    6. luciomuto,
      1) capito, però prendere 40 più 5isti e 80 più 10isti è "ingiusto". è per questo che la tua statistica dà uno scarto inferiore al mio.

      buoni gli event run, ma c'è anche di meglio ("corsaro-premium" :)

      Elimina
    7. anonimo,
      ma che estremi? ma che dici???
      TU non porti alcun dato per annaffiare il tuo mulino. bla bla bla senza alcuna base.
      leggiti il nuovo post che è meglio va...

      Elimina
    8. zedemel, c'è komen... ma ci sono pure i maratoneti. falla tu sta statistica che dici e vediamo se dà 6, no?
      prendiamo questo sì, questo no... così la statistica scema nell'arbitrio.

      Elimina
    9. Ma infatti son proprio dell'idea che ci debba essere l'arbitrio. :-)
      Se intendiamo lo scarto dei migliori elite, io intendo i migliori che si cimentano su entrambe le distanze. Sarà arbitrario ma se ho uno forte che vuol fare entrambe le gare so che fatta una, l'altra scarterà probabilmente 6 (poi potrà essere 1-2 più o 1-2 meno in base a caratteristiche individuali), non certo 14.
      Sarebbe come prendere Tadese per confrontare mezza e maratona, 58' e 2h11', non sarebbe credibile, non ha mai preparato la distanza seriamente.
      Zedemel

      Elimina