Dneska OT (off-topic). Minulý čtvrtek jsem si do vlaku koupil dva politicko-společenské časopisy a zdá se, že x autorů nepochopilo, na co je statistika. Hlavně jim nedochází, že nemohou vyvozovat na nějakou závislost dvou jevů čistě z toho, že to oboje dává vysoká procenta :-)
Klasický příklad na ne-korelaci
Mějme dvě tvrzení. Asi jsou pravdivá, nevím. Ale to není důležité.
- Švýcaři se dožívají v průměru nejvyššího věku
- Švýcaři konzumují nejvíce čokolády na světě
Plno lidem z toho automaticky plyne výsledek, že se dožívají tak vysokého věku, protože ce cpou čokoládou. Ale to je jenom to, co ti lidi chtějí, aby plynulo.
A to je právě ten omyl. Proč by muselo? Nemůže to být tak, že žerou tolik čokolády právě proto, že se dožívají tak vysokého věku a chtějí si trošku zpříjemnit dlouhý pobyt v domově důchodců? A není to tak, že i když žerou tolik nezdravé čokolády, tak to věčné odhánění much požírajících kravnice na pastvinách jim procvičuje krevní oběh?
Jak snad už pochopíte, ani jedno.
Ze dvou statistik na dvou nějakých jevech se nedá usuzovat ani to kravské lejno. Obecně řečeno, nejprve musíme mít nějaké jiné důkazy pro závislost těch dvou jevů a teprve potom můžeme použít statistiku k posouzení jejich vzájemné míry. Ale nemůžu jenom ze statistiky vyvozovat ten vztah. Tomu se říká implikace, jak by řekl pan Studnička!
Trošku opačný business přístup
Co třeba toto - prodávám čokoládu. Je pro mě výhodnější ji prodávat do Švýcarska? Jasně. Delší věk, větší žrouti => větší prodeje. Může mi být úplně jedno, jestli to spolu souvisí, nebo nesouvisí. Když ty dvě hodnoty vynásobím, tak mám lepší zisk.
Tady ale neřeším závislost těch dvou charakteristik. Tady prostě násobím zisky z jednoho i druhého výroku samostatně. Ale už nemůžu čekat, že v jiné zemi, kde se taky dožívají tak vysokého věku, budou taky žrát čokoládu jak zběsilí (i kdyby ten věk mohl záviset jen na jednom faktoru).
A odpověď na otázku z nadpisu?
...
Pozdější úprava: Ještě jeden pohled na věc
Co když máme stejné statistiky pro různé země, kde si tyto dva výroky "odpovídají" nebo jak bych to nazval. Tzn. méně čokolády vs. kratší život, více čokolády vs. delší život. Můžeme z toho vyvodit, že konzumace čokolády prodlužuje život?
Opět nemůžeme. Vždycky to může být přece důsledek jednoho, nebo druhého a stejně tak to může být ve všech případech důsledek něčeho třetího.
Jediné co jsem ochoten uznat je, že v tomto případě je nějaká "důsledkovost" už alespoň trošku vidět. Ale pořád nevíme co je příčina a co je důsledek.