„Spravedlivé“ nalosování soutěže

Nalosování soutěže je věčné a vděčné téma. Otázku obsahující výčitku v podobě: „Proč zrovna já letím s XY čtyřikrát? To je přeci nespravedlivé.“ slýchám dosti pravidelně. Až mě jednou napadlo, jaké je tedy vlastně „nejspravedlivější“ nalosování. Odpověď není ani trochu jednoduchá.

Upozorňuji dopředu, že následující text obsahuje matematiku, kterou někdo nemusí mít rád. Já sám jsem při psaní tohoto článku měl co dělat 🙂 .

Začněme jednoduchou otázkou:
Kolik je možností výběru soutěžního kola.
Nejlépe je to demonstrovat na příkladech.

Příklad 1:
Začnu se 4 piloty A B C D a 2 skupinami, tj. v každé skupině jsou jen dva piloti.
Možných kombinací je 6 a lze je snadno vyjmenovat: AB, AC, AD, BC, BD a CD.

První skupinu je tedy možné vybrat šesti způsoby, druhá skupina je tvořena „zbytkem“ pilotů. Tedy, jedno kolo lze nalosovat právě šesti způsoby: AB-CD, AC-BD, AD-BC, BC-AD, BD-AC a CD-AB. Protože pro účely této úvahy není podstatné, jestli skupina poletí první nebo druhá, ani z jakého startoviště konkrétní pilot poletí (skupiny i piloty na jednotlivých startovištích lze nakonec proházet libovolně), lze považovat AB-CD a CD-AB za stejné případy.

Kolo lze tedy při 4 pilotech a dvou skupinách vybrat právě ze tří možností AB-CD, AC-BD, AD-BC.

Příklad 2:
Další příklad je 6 pilotů A B C D E F ve 2 skupinách.

Možných kombinací je 20. I zde je lze vyjmenovat, pro názornost v několika řádcích:
ABC, ABD, ABE, ABF, ACD, ACE, ACF, ADE, ADF, AEF
BCD, BCE, BCF, BDE, BDF, BEF
CDE, CDF, CEF
DEF

Jako v předchozím případě i zde je unikátních možností (bez ohledu na pořadí skupin) právě polovina, tj. 10, protože každé volbě v první skupině odpovídá jediná možnost druhé skupiny.

Příklad 3:
Teď to bude těžší, 6 pilotů ve třech skupinách.

Možných kombinací je 15:
AB, AC, AD, AE, AF
BC, BD, BE, BF
CD, CE, CF
DE, DF
EF

Do první skupiny vyberu první dvojici, takže mi pro druhou a třetí skupinu zbydou 4 piloti, které mohu „rozhodit“ šesti způsoby (viz první příklad). Poslední skupina je „doplněk“. Následující tabulka vypisuje všechny možnosti:

Celkem je tedy 15*6=90 možností, řádky 2 a 3 jsou vzájemně svázané.

Žlutě jsou vyznačeny stejné kombinace AB-CD-EF, kterých je 6. V 90 možnostech je tedy 15 šestic. Jedinečné jsou tedy pouze kombinace vyznačené tučně, kterých je 15.

Už z těchto jednoduchých příkladů je zřejmé, že na výpis všech možností obvyklé soutěže by nestačil papír. Například pro soutěž s 18 piloty ve třech skupinách je možností nalosování jednoho kola 2 858 856.

Odvození (klidně přeskočte)

V matematice se používají termíny kombinace a permutace. Kombinace je výběr prvků, v němž nezáleží na pořadí, při permutaci na pořadí záleží. Kombinace písmen A a B je jen jedna AB, permutace jsou dvě AB a BA. Matematická funkce C(n,p) vrátí počet kombinací p prvků z celkem n prvků. Matematická funkce P(n,p) vrátí počet permutací p prvků z celkem n prvků. Obě tyto funkce má každá lepší kalkulačka.

N … počet pilotů
s … počet skupin
m … počet pilotů v každé skupině (platí, že N = s*m)

Pro první skupinu je C(N,m) kombinací, další se skupina se vybírá už jen z N-m pilotů, takže pro druhou skupinu existuje C(N-m,m) kombinací. Pro předposlední skupinu je to C(2m,m) a poslední skupina je „zbytková“, C(m,m)=1.

Některé kombinace se v tomto počtu možností opakují. V počtu možností první skupiny jsou všechny m-tice. Ve druhé skupině se objeví m-tice, které už jsou uvedený i pro první skupinu. V losování každé další skupiny se objeví m-tice, které už byly nalosovány dříve. M-tice z jedné skupiny je M1, z druhé M2, ze třetí M3, atd. Když jsou dvě skupiny, objeví se ve výpisu možností M1-M2 i M2-M1. Když budou skupiny tři, objeví se M1-M2-M3, M1-M3-M2, M2-M1-M3, M2-M3-M1, M3-M1-M2, M3-M2-M1. To je ovšem permutace P(s,s).

Celkový počet možností, jak vybrat piloty do „s“ skupin jednoho kola je tedy dán výrazem
n=C(N, m)*C(M-m,m)*…*C(2m, m)*C(m, m)/P(s,s)

Konec odvození

Kolik je možností výběru soutěže.

Soutěž nemívá jen jedno kolo. Jestliže je pro jedno kolo X možností, potom pro dvě kola je to X*X, pro 3 kolo X*X*X atd. A číslo počtu nalosování celé soutěže se zvětšuje, nul utěšeně přibývá 🙂 , výsledná čísla jsou nepředstavitelně vysoká.

Závěrem této kapitoly tedy může být to, při větším počtu pilotů a kol nelze hledat „nejspravedlivější“ výběr systematicky. Dovedu si představit (byť obtížně), že při šesti pilotech v soutěži si vypíši všechny varianty a vyberu tu nejlepší. Při velkém počtu pilotů je systematický přístup mimo schopnosti člověka a pravděpodobně i soudobé výpočetní techniky, proto je nutné použít jinou strategii, jak bude ukázáno níže.

Bez ohledu na to, zda hledám to správný výběr systematicky nebo náhodně (losováním), potřebuji vědět, podle jakého kritéria mám varianty prohledávat a vybírat tu nejlepší.

Kritérium spravedlivosti.

„Nespravedlivé“ nalosování obvykle znamená, že někdo letí proti někomu vícekrát. Proto lze kritérium výběru sestavit na základě počtů, kolikrát proti sobě jednotliví piloti letí. Lze si ale vymyslet i libovolné jiné.

Opět teoretická vložka k přeskočení.

Když má N pilotů letět každý s každým, je to N*(N-1)/2 možností. V jedné skupině s m piloty takových soubojů najednou proběhne m*(m-1)/2. Pokud se má 18 pilotů utkat každý s každým, bude soubojů 153. V jedné skupině 6 pilotů se najednou těchto soubojů odehraje najednou 15. V kole 45 a v soutěži o 6 kolech 270. Takže už z těchto čísel je jasné, že někteří budou muset proti některým letět vícekrát.

Ve skutečnosti lze mít samé jedničky v tabulce „kdo s kým“ jen v případě, že počet startovišť krát (počet kol minus 1) je počtem pilotů. Třeba 16 pilotů může na 4 startovištích odlétat 5 kol a všichni se potkají právě jednou. Opravdu, počet dvojic je 16*15/2 = 120, počet soubojů v každé skupině 4*3/2=6, v kole tedy 24 a v pěti kolech 120.

Ona ale tato shoda 120=120 je podmínkou nutnou, nikoliv však postačující.

Konec teorie.

Z výbrané varianty lze zjistit, kolikrát proti sobě jednotlivé dvojice pilotů letí. Kritérium poté může definovat následující tabulka


Pokud chceme omezit to, aby proti sobě piloti letěli vícekrát, měly by to váhy zohledňovat. Po pokusech jsem zvolil váhy v podobě 3. mocniny, tj. w0=0, w1 = 1^3 = 1, w2 = 2^3 = 8, w3 = 3^3 = 27 atd. V takovém případě algoritmus upřednostní variantu, v níž například 3 páry pilotů proti sobě poletí 2x, oproti variantě, ve které by jeden pár pilotů proti sobě letěl 3x (protože 3*8 = 24, což je méně než 1*27 = 27).

Není to ale jediná možnost, například se mi nemusí líbit, že by se některé dvojice nepotkaly vůbec, a potom mohu nějakou váhu přiřadit i nulám. Výběr to samozřejmě ovlivní.

Pro 6 pilotů ve dvou skupinách a čtyřech kolech dostanu v závislosti na váze u nuly následující výsledky. Váha 0 znamená, že mi vůbec nevadí, pokud se někteří piloti v soutěži nepotkají, váha 8 znamená, že nepotkat se je stejně špatné jako potkat se dvakrát, váha 27 potom odpovídá 3 společným soubojům.

Nejlepší výsledek pro w0=8 znamená, že sice bude jen jeden pár pilotů, který nezměří síly přímo, ale zato 2 dvojice proti sobě poletí 3x, což už mohou nemile nést. Ještě větší váha u nuly zajistí, že poletí každý proti každému, ovšem za cenu toho, že se jedna dvojice potká 4x.

Mně přijde pocitově nejspravedlivější výsledek pro váhu 0. Tři dvojice pilotů se nepotkají vůbec a ostatní možné dvojice poletí každý s každým právě dvakrát. Dále se budu tedy držet tohoto kritéria. Nicméně závěrem této části může být, že kritérium spravedlivosti je velmi subjektivní pojem.

Počítačové losování.

Jak je uvedeno výše, pro malý počet pilotů je celkem dobře možné vypsat všechny varianty soutěže, spočítat skóre jednotlivých možností a vybrat tu nejlepší. Pro větší počet už to možné není, počet variant jsou čísla s desítkami nul.

Počítače jsou snadno a rychle nalosovat soutěž náhodným způsobem (což se samozřejmě v programech, jako je Sorg nebo Gliderscore, děje). Při náhodném losování je ovšem vždy namístě otázka, zda je takový výsledek „spravedlivý“. Má odpověď je opatrné ne, jak se pokusím vysvětlit dále.

Počítač dokáže vygenerovat tisíce nalosování soutěže v rozumném čase. Tisíce jsou ovšem stále pouze nepatrný zlomek všech možností, ale zdá se, že to nevadí, i náhoda má své zákonitosti (asi jako když se provádí průzkum volebních preferencí na vzorku 1000 lidí, zatímco voličů jsou miliony).

Tedy, modelovým příkladem je již zmíněná soutěž s 18 piloty, 3 skupinami, 6 koly. Váhy jsou 3. mocniny.

Program proběhne 1000x. Oproti počtu všech možností, které vyjadřuje číslo se 38 nulami, je to zdánlivě málo. Ale zdá se, že to stačí, neboť všechny běhy (1000 losování v každém běhu) vrací velmi podobné výsledky.

Tedy, program proběhne 1000x a spočítá skóre pro všech 1000 variant. Interval mezi minimálním a maximálním skóre se rozdělí na intervaly a spočítají se počty hodnot, které spadají do daného intervalu.


Hezky ostře ohraničený „kopeček“ ukazuje, že většina losování (řekněme 70%) spadá do průměru mezi řekněme 1850 a 2100. Minimálních skóre, tj. dobrých, či spravedlivých nalosování se dosahuje jen asi v 1%.


Rozdíly mezi dobrým a průměrným nalosováním ukazuje tato tabulka.

Když se zaměřím jen na vysoké počty vzájemných letů, tak v průměrném losování se spolu 4x utká 8 dvojic pilotů a 5x 1 až 2 dvojice. Při dobrém nalosování budou „4-letových nešťastníků“ jen 4 páry a pětinásobný souboj nebude žádný.
Nicméně lze uzavřít, že dobré řešení je o dost lepší než průměrné.

Zde je dobré připomenout, že popsaný způsob nenalezne nejlepší řešení, jen poměrně dobré řešení. Při mých pokusech mi program našel variantu se skóre 1500, ale obvykle je nejmenší skóre z běhu 1000 pokusů okolo 1600. Takže nelze s jistotou určit, zda někde neexistuje varianta s ještě menším skóre. Pravděpodobně ano, ale vzhledem k ostrému „kopečku“ je tato pravděpodobnost extrémně malá.

Shrnutí.

Tedy, náhodně nalosovaná soutěž s velkou pravděpodobností není spravedlivá (ve smyslu definovaného kritéria). Otázkou je, zda to vadí. Podle mě ne (viz tento předchozí článek), ale vykládejte to někomu, kdo se cítí ukřivděný, pocity jsou víc než nějaký teoretický rozbor.

Řešení vidím dvě:
(a) Provést losování mnohokrát (řekněme 100-1000x) a vybrat to, které nejlépe splňuje požadované kritérium; v větším počtu losování je pravděpodobné, že se vybraná varianta bude nacházet na levém úpatí „kopečku“. Pro obvyklý počítač je to úloha na desítky sekund až jednotky minut.

(b) Použít předdefinované šablony; pro každou kombinaci počtu pilotů, startovišť a kol by musela být připravená předem. Například pro popisovaný příklad 18 pilotů, 3 skupin a 6 kol může matice vypadat takto:


Písmenům A až R lze jména pilotů přiřadit libovolně, rovněž lze libovolně prohodit řádky (skupiny) v jednotlivých kolech a sloupce (startoviště) v jednotlivých řádcích (skupinách). Uznávám ale, že řešení podle (a) je lepší.

Předpokládám, že už to někdy někdo dávno řešil a vyřešil přede mnou. Ale mě takové intelektuální výzvy baví, i když praktický užitek asi nemají.

Honza
11.10.2019

komentáře 4

  1. Teda matiku mám rád a rád si taky hraju, ale tohle je trošku maso a „sebemrskačství“ 🙂
    Jak píše Ruda, hezky se to čte. Je krásně vidět, že při standartním počtu startujících je prakticky nemožné nalosovat spravedlivě. Ale jak píšeš v odkazovaném článku, je to prostě fuk, jde hlavně o pilota.
    Moc hezky jsi si v tom porochňal 🙂

  2. Kluci, děkuji za pochvalu, jak jsem napsal, vzal jsem to spíše jako intelektuální výzvu, mě totiž kombinatorika nikdy moc nešla 🙂 .
    A taky si říkám, že namísto „jak já k tomu přijdu, že musím 4x letět proti XY“ je lepší „chudák XY, letí 4x se mnou“ 🙂 . H.

Napsat komentář

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *

Přidejte obrázek (JPEG only)