Náhoda vs. pilotní umění

Na Ukrajině se létal Wilga Cup. Výsledky jsem „podrobil“ statistickému zkoumání. Létalo 30 pilotů, celkem 8 základních kol. Jedno kolo bylo škrtací, následující data však uvažují všech 8 kol.

Prvním krokem je úvaha, že výkon pilota je součtem jeho skutečného pilotního umění a náhody. Pod náhodu se v tomto případě schová všechno, například nalosování kola, počasí, síly soupeřů, spolehlivost techniky, apod.

Druhým krokem je představa, že po dostatečném počtu kol se náhodné vlivy „vyruší“ a konečné umístění pilota odpovídá jeho skutečnému pilotnímu umění (samozřejmě že nikoliv absolutně, nýbrž relativně vůči ostatním pilotům a aktuálním podmínkám soutěže).

Náhodu tak lze odhadovat z pořadí v jednotlivých kolech vůči pořadí konečnému.


Na prvním obrázku označují zelené „mašličky“ konečný stav. Body jsou srovnané na přímce (schválně :-)). Na vodorovné ose je konečné umístění pilota (po 8. kole), na ose svislé potom umístění v kole aktuálním (v tomto případě tedy 8.). Zelené body jsou tedy referenční, dle výše uvedeného neobsahují náhodu. Modré čtverečky potom označují umístění pilota v kole prvním. Je vidět, že:
– v prvním kole byly 3 „tisícovky“, protože jsou 3 piloti na 1. místě (na konci skončili na 1., 3. a 8. místě);
– pilot, který byl nakonec čtvrtý, byl po prvním kole až 22.,
– rozptyl (a tedy vliv náhody) je značný.

Nicméně je zřejmé, že, při pohledu z dálky, jsou modré body „narovnané“ okolo zelené čáry. Ne moc, ale nějaká tendence patrná je.

Na dalším obrázku je stav po 4. kole.


Zelené trojúhelníčky už jsou k „mašličkám“ přimknuté mnohem těsněji. Náhoda v jednotlivých letech se vzájemně ruší a výsledky se již blíží skutečnému pilotnímu umění.

Zcela zřejmé je to ze stavu po 7. letu.


Poslední let znamenal změnu v konečném pořadí jen pro málo pilotů a většinou jen o několik míst.

Vliv náhody lze ocenit jediným číslem, kterému se říká korelační koeficient. Máme-li dvě řady čísel, o kterých se domníváme, že spolu souvisí, což je přesně náš případ, lze je podrobit matematickému zpracování (v Excelu je na to funkce, takže nic složitého :-)), které vrátí jedno jediné číslo vyjadřující shodu obou řad. Když je korelační koeficient 0, řady čísel spolu vůbec nesouvisejí, když je 1, je shoda naprosto přesná.

Následující graf ukazuje růst korelačního koeficientu po jednotlivých kolech:


Korelační koeficient po 1. kole je tedy asi 0.55, po 4. kole asi 0.8, po 7. kole asi 0.97.

V grafu jsou i další soutěže:
– F5J Wilga Cup, 2012, 30 pilotů, 8 letů
– F5J Dubnica, 2011, 21 pilotů, 6 letů
– RCEK Hořice, 2010, 32 pilotů, 4 lety
– RCEK Nová Paka 2010, 27 pilotů, 5 letů
ale protože nejsou stejné počty letů, nelze jednotlivé soutěže mezi sebou porovnávat. U obou RCEK soutěží byl však skok mezi předposledním a posledním kolem výrazný (velká změna korelačního koeficientu), což ukazuje na malý počet kol.

První otázkou je, kolik je třeba letět startů, aby výsledek nezahrnoval náhodu, nebo jen v přijatelné míře. Samozřejmě, čím více, tím lépe, nicméně korelační koeficient umožňuje přesnější určení. Mně se zdá, že vhodnou hranicí je, aby korelace mezi předposledním a posledním kolem byla alespoň 0.95. To potom vede minimálně k 6, spíše 7 kolům.

Druhou otázkou je, zda má smysl finále. Jednokolové asi ne. Vliv náhody je příliš veliký, finálová kola by měla být nejméně 3.

Osobně jsem proti koncepci finále, hlavně kvůli tomu, že většina lidí se „nezaměstnaně“ poflakuje po letišti a čeká na konec.

Určitě je lepší zvýšit počet letů pro všechny, ale více než nějakých 8 až 10 letů také nemá smysl, výsledky už jiné nebudou. Mně by se líbilo rozdělit v polovině soutěže lidi do několika výkonnostně vyrovnaných skupin, určitě by byla soutěž mnohem napínavější, protože by v každém kole šlo o umístění (pokud by byl systém, jak vítěze Finále „C“ nějak bodově do žebříčku odměnit).

Tedy, pokud by z tohoto měl být nějaký závěr, tak létat na minimálně 6 a maximálně 10 kol a bez finále. Nejlepšího pilota tak bude možné najít s pravděpodobností blížící se jistotě ;-).

Honza