Jednou si někdo pořádně nadrobil, když zjišťoval, zda mají kuřáci ve škole horší známky než nekuřáci. Ukázalo se, že mají. To potěšilo spoustu lidí, kteří s tím potom pracovali, jak jen se dalo. Vzniknul dojem, že přestat s kouřením je cesta, jak dosáhnout lepších známek; a – když to domyslíme dál – že kouření otupuje mysl.

Tato konkrétní studie byla podle mého soudu provedena naprosto správně: vzorek byl dostatečně velký, byl poctivě a pozorně vybraný, korelace byla vysoká a tak dále.

Omyl, ke kterému tady došlo, je prastarý. Má však tu otřesnou vlastnost, že proniká do statistických materiálů, zamaskovaný ve změti působivých čísel. Spočívá v tom, že když má jev B stejný průběh, jako jev A, automaticky si řekneme, že jev B byl způsoben jevem A.

Zdroj: Irving Geis

V daném případě byl přijat ničím nepodložený předpoklad, že kouření a špatné známky spolu souvisejí a tedy, že kouření způsobuje špatné známky. Nemohlo by to ale být stejně dobře i naopak? Možná, že špatné známky vedou studenty k tomu, aby nepili, ale aby kouřili. Kdyby na to přišlo, tento závěr může být stejně pravděpodobný, jako ten původní a bude také podpořen fakty. Pro nějakou propagaci ale není zdaleka tak přitažlivý.

Ve skutečnosti je mnohem pravděpodobnější, že se tyto jevy navzájem vůbec neovlivňují, ale že jsou oba způsobeny nějakým třetím faktorem. Není například možné, že člověk družného typu, který nebere své učebnice příliš vážně, má také silnější sklon ke kouření? Nebo je vodítkem to, že někdo jednou vytvořil vztah mezi extrovertní povahou a špatnými známkami – což k sobě má evidentně blíž než známky a inteligence? Možná, že extroverti kouří víc než introverti. Pointa je v tom, že když existuje víc rozumných vysvětlení, nemáte právo si vybrat jen to jedno, které se vám nejlépe hodí do krámu a trvat na něm. Mnozí lidé to ale tak dělají.

Abyste nepodlehli klamu následné příčiny a slepé víře v něco, co ve skutečnosti vůbec neexistuje, je nutno podrobit každé tvrzení o příčinách a důsledcích důkladnému zkoumání. I když je souvislost určitých jevů doložena s přesvědčivou přesností a přesto, že se zdá, že jeden jev byl způsoben druhým, může se ve skutečnosti jednat o souvislost některého z následujících typů.

Především to může být vztah, který vznikne náhodou.  Dáte dohromady sadu dat, která prokazují něco málo pravděpodobného a když to zkusíte znova, dostanete další sadu, která to vůbec nemusí potvrdit. Budete si počínat jako ten výrobce zubní pasty, u níž se zdálo, že potlačuje zubní kaz: Zahodíte výsledky, které vám nevyhovují a široce publikujete ty, které vám vyhovují. Na malém vzorku najdete nějaký významný vztah mezi dvěma libovolnými vlastnostmi nebo jevy celkem snadno a hned máte o čem přemýšlet.

Běžným typem vzájemné souvislosti je takový vztah dvou veličin, který sice reálně existuje, ale nelze přesně určit, která z těch veličin je příčinou a která důsledkem. V některých takových případech si příčina a důsledek čas od času mezi sebou pozice navzájem vymění, nebo mohou obě být současně i příčinou i důsledkem. Příkladem tohoto typu je vztah mezi příjmem a vlastnictvím akcií. Čím víc peněz vyděláte, tím víc akcií si koupíte, tím vyšší je váš příjem; pak se nedá tak úplně přesně a jednoduše říct, že jedno je způsobeno druhým.

Snad ze všech nejošidnější je takový velice běžný případ, kdy se oba jevy vzájemně neovlivňují, ale přesto tu statistická korelace existuje. S tím už se nadělala spousta špinavé práce. Do této kategorie omylů patří i ty špatné známky kuřáků, zejména sem ale patří velké množství lékařských statistik, které jsou citovány, aniž by se uvažovalo, zda ten vztah příčiny a důsledku reálně existuje nebo je jen výplodem spekulací. Jako typický příklad falešné korelace lze uvést těsný vztah mezi mzdou presbyteriánských kněží v Massachusetts a cenou rumu v Havaně.

Co je příčinou a co důsledkem? Jinými slovy – mají kněží prospěch z obchodu s rumem nebo jej dokonce podporují? Tohle je samozřejmě tak nepravděpodobné, že je to už na první pohled směšné. Dejte však pozor na další příklady vadné logiky následných příčin, které se od této liší pouze tím, že nebijí tolik do očí. V případě knězů a rumu se dá snadno odvodit, že obě čísla rostou v důsledku třetího faktoru: historického a celosvětového růstu cenové hladiny prakticky všeho.

Vezměte ale například údaj, že nejvíc sebevražd je v červnu. Má větší počet sebevražd vliv na zvýšení vdavekchtivosti mladých žen? Nebo naopak červnové svatby přispívají k sebevraždám zhrzených a opuštěných partnerů?  Poněkud přesvědčivějším (i když stejně neprůkazným) vysvětlení může být, že člověk, který bojuje se svou depresí celou zimu a myslí si, že se situace na jaře zlepší, to vzdá, když přijde červen a on se pořád ještě cítí mizerně.

Zdroj: Irving Geis

Je také nutno si dát pozor na to, abychom nedělali závěry o korelaci, která pokračuje za rámec dat, na kterých byla zjištěna. Jistě lze v některých případech snadno dokázat, že čím víc v určité oblasti prší, tím vyšší zde vyrostou klasy, ba dokonce, že zde bude tím vyšší úroda. Déšť je, zdá se, požehnáním. Ale období velmi silných dešťů může úrodu naopak poškodit nebo dokonce zničit. Až do určitého momentu trvá pozitivní korelace (kladná závislost), pak se rychle mění v pravý opak, tedy v negativní korelaci (zápornou závislost). Tolik a tolik centimetrů srážek představuje určitou hranici. Čím víc pak prší, tím menší úrodu sklidíte.

Dál se podíváme, jakou finanční hodnotu má jedna minuta vzdělávání. Pro tuto chvíli můžeme považovat za prokázané, že absolventi středních škol vydělávají víc peněz než ti, kteří odpadnou a že každý rok, který stráví student na škole, zvyšuje o něco jeho následný příjem. Dejme ale pozor na obecný závěr, že čím déle chodíte do školy, tím víc peněz pak vyděláváte. Všimněte si, že platnost tohoto předpokladu nebyla prokázána pro léta, která následují po maturitě a ono to pro ně zcela jistě ani platit nebude. Lidé s titulem Ph.D. se velmi často stanou pedagogy na univerzitách, a tím pádem se nedostanou do vrstev s nejvyššími příjmy.

Korelace ukazuje samozřejmě pouze tendenci, která neplatí stoprocentně. Vysocí chlapci váží v průměru víc než chlapci malí, což je korelace pozitivní. Snadno ale najdete nějakého dvoumetrového, který váží méně než nějaký jedenapůlmetrový. Pak se jedná o korelaci negativní, tedy menší než 1. Negativní korelace je prostě situace, kdy jedna veličina roste, zatímco druhá má tendenci klesat. Ve fyzice se tomu říká nepřímá úměrnost: čím víc se vzdalujete od žárovky, tím méně světla dopadá na vaši knihu; čím větší vzdálenost, tím nižší intenzita světla. Tyto fyzikální vztahy jsou často „laskavé“ tím, že vytvářejí perfektní korelace. Čísla z ekonomiky, sociologie nebo lékařství takhle dokonale fungují jen ve výjimečných případech. I když vzdělání obecně příjmy zvyšuje, může se snadno ukázat, že někde nějakého Joea vzdělání úplně zruinovalo.  Mějte na paměti, že korelace může být reálná a může být založena na reálném vztahu příčiny a důsledku – a přesto může být zcela bezcenná při posuzování konkrétního jednotlivého případu.

Byly popsány stohy papírů s cílem vyčíslit dolarovou hodnotu univerzitního vzdělání a vydaly se hromady brožurek, aby se na tyto údaje a na závěry, které z nich byly odvozeny, upozornili potenciální studenti. Nechci s těmito závěry polemizovat. Já osobně vzdělávání podporuji, zvlášť, pokud zahrnuje i kurz základů statistiky. Výzkumy velmi přesvědčivě dokazovaly, že lidé, kteří šli na vysoké školy, vydělávají víc peněz než lidé, kteří na ně nešli. Výjimek je samozřejmě celá řada, ale tendence je silná a jasná.

Jediný problém je v tom, že spolu s čísly a fakty se uvádí totálně nepodložený závěr. Je to klam následné příčiny v nejčistší podobě. Podle těchto čísel se říká, že když vy (váš syn, vaše dcera) půjdou na univerzitu, vyděláte pravděpodobně víc peněz, než když se rozhodnete strávit následující čtyři roky nějakým jiným způsobem. Tento závěr je ale nepodložený a vychází ze stejně nepodloženého předpokladu, že když univerzitně vzdělaní lidé vydělávají víc peněz, tak je to proto, protože chodili na univerzitu. My to sice nevíme, ale možná, že by tito lidé vydělávali víc peněz, i kdyby na univerzitu nechodili. Je tu pár věcí, které celkem přesvědčivě naznačují, že to tak je. Na univerzitu se dostává nadproporcionálně vysoký počet dvou typů dětí: chytrých a bohatých. Chytré děti by projevily schopnost dosahovat vyšších výdělků i bez univerzitních znalostí. A pokud jde o bohaté, tak přece víme, že peníze, různými známými způsoby, plodí zase peníze. Jen málo synáčků z bohatých rodin se dostane do nízkopříjmových pásem, ať na univerzitu jdou nebo nejdou.

Následující úryvek je převzatý z rozhovoru, který se objevil v časopise This Week, v sobotní příloze, která měla velký náklad. Možná vám bude, stejně, jako mně, připadat zábavné, že stejný autor jednou napsal článek, nazvaný „Populární pojmy: Pravý nebo falešný?“

Otázka: Jaký vliv má vaše univerzitní studium na možnost, že se neoženíte nebo nevdáte?

Odpověď: Pokud jste žena, pak se možnost, že se nevdáte, prudce zvyšuje. Pokud jste ale muž, situace je obrácená. Možnost, že se neoženíte, je minimální.

Cornellova Univerzita provedla studii mezi 1500 typickými absolventy ve středním věku. Z mužů bylo 93 % ženatých (srovnejte s 83 procenty za celou populaci), ale mezi ženami středního věku bylo vdaných jen 65 %. Mezi vysokoškolsky vzdělanými ženami bylo 3krát víc starých pannen než mezi ženami v celé populaci.

Když si toto přečte 17tiletá Zuzka Brownová, pochopí, že když půjde na univerzitu, najde si muže s menší pravděpodobností, než když na univerzitu nepůjde. Tohle ten článek říká a statistiky z úctyhodných zdrojů to podporují.  Podporují to, ale nepotvrzují; A všimněte si také, že statistiky jsou sice z Cornell’s, ale ty závěry ne, i když člověk po zběžném přečtení může nabýt dojmu, že jsou také z Cornell‘s.

Opět zde byla použita reálná korelace, aby potvrdila neověřený vztah příčiny a následku. Možná, že to celé funguje jiným způsobem a že ty ženy by byly zůstaly neprovdané, i kdyby na univerzitu nešly. Možná, že by se jich neprovdalo ještě víc. Pokud nejsou tyto možnosti o nic lepší než ta, na které trvá autor, pak jsou přinejmenším stejně hodnotnými závěry: jsou to domněnky.

Ve skutečnosti existuje určitý náznak, že mezi staropanenstvím a rozhodnutím jít na vysokou školu, nějaká souvislost je. Dr. Kinsey zřejmě našel určitý vztah mezi sexualitou a vzděláním, který ovšem vzniká už v raném věku. Pak je ale ještě spornější tvrdit, že studium na univerzitě stojí v cestě vdavkám.

Poznámka pro Zuzku Brownovou: Nemusí to nutně tak být.

Jeden lékařský článek poukázal s velkými obavami na zvýšený výskyt rakoviny u lidí, kteří pijí mléko. Ukázalo se, že se rakovina vyskytuje stále častěji v New Englandu, v Minnesotě, ve Wisconsinu a ve Švýcarsku, kde se vyrábí a konzumuje mnoho mléka, zatímco na Ceylonu, kde je mléko vzácné, zůstává výskyt rakoviny řídký.  Pro posílení průkaznosti autoři zdůraznili, že rakovina je méně častá v některých jižních státech, kde se také konzumuje méně mléka. Upozornili také, že anglické ženy, které pijí mléko, dostávají určité typy rakoviny osmnáctkrát častěji než japonské ženy, které pijí mléko jen zřídka kdy.

Stačí jen základní úvaha, abychom našli celou řadu možností, jak tato čísla vysvětlit, ale jeden faktor stačí sám o sobě, abychom měli jasno. Rakovina je především nemoc, která napadá lidi ve středním nebo pozdějším věku. Švýcarsko a další zmíněné země, mají všechny obyvatelstvo s relativně delší dobou života. Anglické ženy se v době, kdy byla tato studie vytvářena, dožívaly v průměru o dvanáct let vyššího věku než ženy japonské.

Profesorka Helen M. Walkerová ukázala vtipným způsobem, jak pošetilá je domněnka, že když se dvě veličiny mění společně, musí mezi nimi existovat vztah příčiny a důsledku. Chcete-li zkoumat vztah mezi věkem žen a některými jejich fyzickými vlastnostmi, začněte tím, že změříte úhel, který svírají jejich chodidla při chůzi. Zjistíte, že u starších žen má úhel tendenci se zvětšovat. Nyní můžete uvažovat, jestli to znamená, že se ženy dožívají vyššího věku, pokud našlapují špičkami od sebe. Rychle zjistíte, že je to absurdní. Tak dojdete k závěru, že čím jsou ženy starší, tím víc našlapují špičkami do stran.

Jakékoliv závěry tohoto druhu jsou nejspíš falešné a každopádně nezaručené. Mohli byste je považovat za legitimní, pokud byste pozorovali stejnou ženu – nebo možná ekvivalentní skupiny žen – po určitou dobu. Tím by byl vyloučen faktor, který je zde zřejmě rozhodující. Totiž ten, že starší ženy vyrůstaly v době, kdy k elegantní chůzi mladých dam patřilo dávat špičky od sebe, zatímco mladší generaci před takovou chůzí varovali.

Když potkáte někoho – většinou zainteresovanou stranu – kdo dělá povyk kolem nějaké korelace, podívejte se nejprve, jestli to není některý z uvedených typů, diktovaný proudem událostí, trendem doby. V současné době se snadno najde pozitivní korelace mezi jakoukoliv dvojící jevů, jako je: počet studentů na univerzitách, počet chovanců v blázincích, spotřeba cigaret, výskyt srdečních onemocnění, používání rentgenových přístrojů, výroba falešných chrupů, platy kalifornských učitelů, zisky hazardních heren v Nevadě. Nazvat některou z nich příčinou některé jiné je ukázkově hloupé. Dělá se to ale každý den.

Když dovolíte, aby statisticky upravená a hypnoticky prezentovaná čísla a desetinné čárky zamlžily příčinné souvislosti, je to jen o málo lepší než uvěřit pověrám. A mnohdy je to daleko závažnější klamání. Je to skoro jako na Nových Hebridách, kde jsou lidi přesvědčení, že vši lidem zajišťují zdraví. Pozorováním po staletí zjistili, že lidé s dobrým zdravím měli vši a nemocní lidé je velmi často neměli. Samotné pozorování bylo přesné a platné, jak už taková pozorování, prováděná neformálně a dlouhá léta, kupodivu často bývají. O závěrech, ke kterým tito primitivní lidé na základě svých poznatků došli, už se ale nic dobrého říct nedá: Vši uzdravují člověka. Každý by je tedy měl mít.

Jak jsme už všimli, i s daleko chatrnějšími důkazy, semletými statistickým mlýnkem tak, že do nich zdravý rozum už neproniknul – nadělali mnozí lékaři velká jmění a napsali poutavé články do časopisů, včetně odborných. Chytřejší pozorovatelé nakonec uvedli věci na pravou míru i na Nových Hebridách. Jak se ukázalo, měl tady vši skoro každý po většinu času. Dá se říct, že to tady byl u lidí normální stav. Když ale někdo dostal horečku (kterou mu nejspíš způsobily právě ty vši), začalo být jeho tělo příliš horké pro pohodlné bydlení a vši odešly. Tady máte příčinu a důsledek pěkně pohromadě, obdobně zdeformované, prohozené a smíchané dohromady.

Poznámka Evy Zamrazilové:

Také název této kapitoly se překládal těžko: „Post hoc rides again“.  Post hoc pochází z latinského „Post hoc ergo propter hoc“ což znamená „Poté, tedy kvůli tomu“ a ve zkráceném znění jako „post hoc“ označuje právě onen logický klam, kdy následuje jeden jev po druhém a my automaticky předpokládáme, že druhý jev byl tím prvním způsoben. „Post hoc rides again“ tedy ve volném překladu znamená, že tento nešvar automatického propojení dvou jevů do vztahu příčiny a důsledku, je tu zas. Opět je na čtenáři, aby si v internetových vyhledávačích ověřil, že tento pojem dodnes funguje k popsání zmíněného nešvaru. Setkáváme se s ním velmi často a o mnohých chatrně podložených kauzalitách se vedou rozsáhlé spory. Mohu připomenout teorii oteplování, ale dnes a denně jsou v různých diskusích odhalovány další příčinné souvislosti mezi nejrůznějšími událostmi. Osmá kapitola této knihy je jednou z nejzávažnějších a řekla bych i nejcennějších. Upozorňuje na jasné a křiklavé příklady a nechává na čtenáři, aby další podobné nesmysly nebo pochybné závěry odhaloval sám. Konec konců, falešná kauzalita začíná už ve chvíli, kdy přinesete ze školy první špatnou známku a máte pocit, že ji způsobil zlý kantor. Ani vás nenapadne, že jste si ji způsobili sami.

V žádné jiné oblasti není statistik v tak vysokém riziku chybné interpretace svých výsledků jako při hledání souvislostí mezi statistickými znaky či jevy. Jestliže existuje statistická souvislost, neznamená to nutně, že jde o příčinnou věcnou souvislost. A lze jasně určit, co je příčina a co důsledek?

Pro situace, kdy údaje vykazují statistickou souvislost, ale logika se vzpěčuje, má statistika název zdánlivá korelace, falešná korelace, pseudo korelace, nebo dokonce lži-korelace. Jak zdánlivou korelaci rozpoznat? Některé příklady, které autor uvádí, jsou natolik absurdní, až jsou zcela evidentní a do očí bijící.  Velice častou příčinou zdánlivé korelace je existence třetího „opomenutého“ faktoru, který ovlivní oba adepty falešné korelace tím směrem, že se chovají podobně – jakási šedá eminence v pozadí. Jen pro příklad si všimněte, že mezi hospitalizovanými s covidem-19 vzrostl podíl očkovaných. Jednoduchý závěr může být, že očkování zvyšuje riziko hospitalizace. Pravdou ovšem je, že očkovaní hospitalizovaní pacienti jsou většinou vyššího věku. To je ta šedá eminence v pozadí, odborně bychom řekli „zavádějící proměnná“, která ovlivňuje oba korelující jevy, jejichž korelace ovšem ještě neznamená souvislost příčinnou (tedy že jedna je příčinou druhé), tzv. kauzalitu.

Nicméně jsou zde i případy vzniklé chybou v logice uvažování. Například vždy bude v čase existovat silná negativní závislost mezi podíly ekonomicky aktivních a neaktivních  osob v populaci, a to proto, že jejich podíly dohromady tvoří celek, tedy 100 % – nebo se mu alespoň velmi blíží. Jestliže jeden ukazatel roste, druhý musí nutně klesat – lidé nejsou většinou zaměstnaní i nezaměstnaní zároveň (případ chytré horákyně je samozřejmě českým specifikem, který statistika těžko zachytí). Stejně je to s kuřáky a nekuřáky, voliči a nevoliči a mnoha dalšími případy. Tyto příklady jsou evidentní, ale mohou se vyskytnout v sofistikovanější formě. Mnoho zajímavých příkladů falešných korelací můžete najít v knize Dr. Helmuta Swobody: Moderní statistika.

Poznámka ČSÚ – Tereza Košťáková, Petr Musil

Jakákoliv statistická analýza musí vycházet z věcné podstaty zkoumané oblasti a slouží „pouze“ jako nástroj zkoumání. Samotná statistická závislost – pokud ji zjistíme – ještě sama o sobě nemusí znamenat skutečnou věcnou vazbu mezi jevy (proměnnými) a už vůbec ne to, že jeden jev je příčina a druhý jeho důsledek. Při jakékoliv analýze nesmíme zapomínat na věcné souvislosti mezi jevy.

Dnes, stejně jako před 50 lety, jsou daleko běžnější a také nebezpečnější případy, kdy jsou zkoumány jevy, které spolu zdánlivě souvisejí, ale tím to také končí. Nebo když se jeden takový jev prezentuje jako příčina a druhý jako následek, bez zjevného prověření, že by to také mohlo být obráceně. D. Huff uvedl několik příkladů velmi špatně provedených analýz, ve kterých byla zaměněna kauzální (příčinná) závislost a vzájemná závislost. A upozorňuje také na nebezpečí tzv. zdánlivé závislosti, kdy zkoumané proměnné ovlivňuje další skrytá proměnná, kterou však autor analýzy nezahrnul do modelu. Vzhledem k tomu, že takové „háčky“ nemusí být na první pohled zjevné, člověk se může velmi rychle dostat na scestí. Dobrou radou pro ty, kteří analýzy provádějí, stejně jako ty, kteří výsledky takových zkoumání čtou a slyší, je kriticky přemýšlet a při sebemenší pochybnosti a nejasnosti klást otázky.

Základním posláním statistických úřadů je tvorba statistik pro široký okruh uživatelů. Vedle toho publikuje ČSÚ také analýzy, které jsou zaměřené zejména na vysvětlení příčin vývoje ukazatelů a příspěvků jednotlivých složek, nikoliv na hledání příčin a následků. Analýzy ČSÚ se proto mohou někdy zdát příliš opatrné. Ale není tomu tak. Takové analýzy jsou totiž průvodcem uživatele po klíčových částech, které vstupují do souhrnného (a někdy hůře uchopitelného) ukazatele. Uživatel se například dozví, zda k růstu či poklesu hrubého domácího produktu přispěla více zahraniční poptávka nebo spotřeba domácností či vlády. To jsou velmi cenná zjištění.

Na druhou stranu posláním ČSÚ není tvorba mezioborových či mezinárodních studií, například zkoumání dopadu změn v zahraničních ekonomikách na HDP České republiky. Poskytuje však podkladová data, na základě nichž může například akademická sféra vybudovat modely, které takové kauzální a vzájemné závislosti zkoumají.

Foto: redakce EM

Zdroj: Darrell Huff

Devátá kapitola vychází už 19. 4. 2022