e-news.cz - kurzy
Reklama

Jak lhát se statistikou: Jak statistikulovat (Kapitola 9 )

19.04.2022, Autor: Laura Feketeová

0 votes, average: 0,00 out of 50 votes, average: 0,00 out of 50 votes, average: 0,00 out of 50 votes, average: 0,00 out of 50 votes, average: 0,00 out of 5
Jak lhát se statistikou: Jak statistikulovat (Kapitola 9 )

Dezinformování veřejnosti s využitím statistických materiálů se dá považovat za manipulaci; mohlo by se to také nazývat statistikulace (i když to slovo není moc pěkné). Podle názvu této knížky a některých příkladů, které jsou v ní uvedené, by se mohlo zdát, že cílem všech takových postupů je klamat.


Nedávno mi kvůli tomu vynadal prezident pobočky Americké statistické asociace. Řekl mi, že ve většině případů nejde o záměr, ale o neschopnost. Na tom, co říká, možná něco bude[1], ale nejsem si jistý, která z těch dvou možností je pro statistiky méně hanlivá. Možná je důležitější si uvědomit, že deformace statistických dat a manipulace s nimi, není konec konců vždy záležitostí jen profesionálních statistiků. To, co z rukou statistiků vyjde jako zcela korektní, mohou překroutit, přehnat, příliš zjednodušit a výběrem zkreslit obchodníci, lidé z public relations, novináři nebo tvůrci reklamních sloganů.
Ale ať už je v konkrétním případě viníkem kdokoliv, těžko ho lze považovat jen za nevinného packala. Klamavé grafy v novinách a časopisech vytvářejí často senzace tím, že přehánějí, zřídka cokoliv podcení. Podle mých zkušeností lidé, kteří jménem průmyslových odvětví prezentují statistické argumenty, těžko dají k dispozici taková čísla, která by dělníkům nebo odběratelům nahrávala víc, než je nezbytně nutné. Spíš jim trochu uškodí.  Zaměstnaly snad někdy odbory tak neschopného statistika, že by jejich požadavky podcenil místo přehnal?
Pokud jdou chyby stále jen jedním směrem, těžko to přisuzovat jen břídilství nebo náhodě.
Jedním z nejošidnějších nástrojů dezinterpretace statistických dat jsou mapy. Taková mapa obsahuje velké množství proměnlivých veličin, ve kterých se dají fakta ukrýt a zkreslit. Mou oblíbenou trofejí v tomto oboru je mapa, které říkám „Matoucí šrafování“. Nedávno ji zveřejnila First National Bank of Boston a dál ji pak vehementně šířily tzv. zájmové skupiny daňových poplatníků, noviny a časopis Newsweek.
Tato mapa ukazuje, jakou část našeho národního důchodu si bere a spotřebovává federální vláda. Znázorněno je to tak, že jsou vyšrafovány oblasti států na západ od Mississippi (vyjma Louisiany, Arkansasu a části Missouri), což znamená, že federální vláda spotřebuje tolik, kolik celkově vydělají lidé v těchto státech.
Podvod spočívá v tom, že se vybraly státy, které mají velká území, ale vzhledem k řídkému osídlení, relativně malé příjmy. Se stejnou poctivostí (a stejnou nepoctivostí) měl ten, kdo mapu vyráběl, začít se šrafováním v New Yorku nebo v Nové Anglii a plocha, kterou by vyšrafoval, by byla daleko menší a méně působivá. S použitím stejných dat by byl vytvořil úplně jiný dojem v mysli každého, kdo se na jeho mapu podívá. Nikdo by se ovšem také neobtěžoval takovou mapu dál publikovat. Konec konců nevím o žádné zájmové skupině, která by měla zájem prezentoval veřejnou spotřebu nižší, než jaká ve skutečnosti je.
Pokud by byl autor mapy chtěl pouze zprostředkovat informace, které měl k dispozici, mohl to udělat celkem snadno. Byl by mohl vybrat skupinu průměrných států, jejichž rozloha má k celkové rozloze USA stejný poměr, jako má jejich produkt k celkovému produktu USA.
Je to jasný pokus o klamání veřejnosti, ale není to v propagandě zdaleka nový trik. Je to klasika. Starý, otřepaný fór. Jistá banka publikovala už dříve různé varianty této mapy, aby ukázala federální výdaje v letech 1929 a 1937. Tato mapa se pak objevila v učebnici Grafická prezentace od Willarda Cope Brintona, jako odstrašující příklad. Tato metoda „překrucuje fakta“ řekl Brinton naplno. Ale First National klidně pokračuje v kreslení map a Newsweek a další lidé, kteří by měli vědět o co jde – a nejspíš také vědí – je klidně dál přetiskují, aniž by někoho varovali nebo se omluvili.

Zdroj: Irving Geis

MATOUCÍ ŠRAFOVÁNÍ
Jaký je průměrný příjem amerických rodin? Jak jsme už poznamenali dříve, Statistický úřad říká, že „v roce 1949 měla průměrná rodina příjem 3.100 dolarů“. Když ale v novinách čtete zprávu o „dobročinných darech“, kterou vydala Nadace Russell Sage[2], dozvíte se, že to za stejný rok bylo pozoruhodných 5.004 dolarů. Když jste se dozvěděli, že se lidem vedlo tak dobře, tak vás to možná potěšilo, nebo jste naopak byli trochu zklamáni tím, jak málo tento údaj ladí s vašimi vlastními zkušenostmi. Třeba se nestýkáte s těmi správnými lidmi.
Jak je ale možné, že jsou světy Russella Sage a Statistického úřadu tak vzdálené?  Úřad se vyjadřuje prostřednictvím medianu, tedy tak, jak správně má. Ale i kdyby lidé od Sage použili aritmetický průměr, rozdíl by neměl být až takhle velký. Jak se ukázalo, Nadace Russella Sage došla k tomuto blahobytnému údaji tak, že vytvořila virtuální rodinu. Jinak se to nazvat nedá. Svůj postup vysvětlili (když o to byli požádáni) takto: vzali celkové příjmy amerických občanů, vydělili je počtem obyvatel, tedy 149ti miliony a dostali průměr 1.251 dolarů na jednoho obyvatele. „Což znamená“, jak dodali, „5.004 dolarů pro čtyřčlennou rodinu.“
Tento podivný typ statistické manipulace přehání dvěma způsoby. Jednak používá aritmetický průměr, namísto menšího a lépe vypovídajícího medianu … to je něco, s čím už jsme se vypořádali v jedné z předešlých kapitol.  Dále je zde předpoklad, že příjem rodiny je přímo úměrný její velikosti. Takže když mám čtyři děti, přeji si, aby to tak fungovalo, ale ono to tak není. Čtyřčlenné rodiny rozhodně nebývají dvakrát bohatší než rodiny dvoučlenné.
Buďme ale spravedliví ke statistikům od Russella Sage, o nichž se dá předpokládat, že se neprovinili snahou podvádět. Budiž řečeno, že jejich hlavním záměrem bylo vytvořit dojem, že je lepší dávat než brát. To legrační číslo o příjmech rodin bylo jen vedlejším produktem. Účinnost šíření tohoto bludu tím ale nijak neklesá. Nadále je to jasný příklad toho, že blíže neurčenému průměru se nedá moc důvěřovat.
Desetinná čárka vytváří falešný nádech přesnosti a nejpochybnějším statistikám tak dává punc závažnosti. Zeptejte se stovky občanů, kolik hodin minulou noc spali. V součtu vyjde, řekněme 783,1. Jakýkoliv takový údaj je předně na hony vzdálený od toho, aby byl přesný. Většina lidí dokáže odhadnout dobu svého spánku s přesností na 15 i více minut a nikde není psáno, že se tyto odchylky navzájem vyruší. Každý známe někoho, komu bude pět minut bez spánku připadat, jako že se polovinu noci vrtěl v posteli a nemohl usnout. Pojďme ale dál. Provedete výpočet a můžete ohlásit, že lidé spí v noci v průměru 7,831 hodiny. Bude to vypadat, že víte naprosto přesně, o čem mluvíte. Kdybyste byli tak bláhoví, že byste pouze oznámili, že lidé spí za noc 7,8 (nebo „téměř 8“) hodin, nikdo by se nad tím nepozastavil. Znělo by to tak, jak to ve skutečnosti je, tedy jako obyčejná přibližná hodnota, což by nebylo o nic poučnější než odhad, který může udělat kdokoliv.
Karel Marx neodolal a také použil nádech přesnosti stejného střihu. Když vysvětloval „míru nadhodnoty“ v mlýnu, začal s nádhernou sbírkou předpokladů, odhadů a zaokrouhlených čísel: „Předpokládejme, že odpad je 6 % … surovina … stojí zaokrouhleně 342 libry. 10.000 vřeten … stojí, předpokládejme, 1 libru za vřeteno … opotřebení dáme 10 % … nájemné za budovu předpokládejme, že bude 300 liber …“ a pak říká: „Tato data, ze kterých budeme vycházet, mi dal jeden přadlák z Manchesteru.“
Z těchto odhadů Marx vykalkuloval, že: „Míra nadhodnoty je proto 80/52 = 15311/13 %“ při desetihodinové pracovní době mu to dává „nezbytnou práci – 3 21/33 hodin a přidaná hodnota = 6 2/33.“
Ty dvě třiatřicetiny hodiny vzbuzují příjemný pocit přesnosti. Ale všechno je to blaf.
Procenta jsou živnou půdou pro zmatení čtenáře. Stejně jako ta působivá desetinná čárka, mohou zcela nepřesnému sdělení propůjčit dojem přesnosti. Měsíční přehled práce Ministerstva práce Spojených států jednou uvedl, že 4,9 % nabídek zaměstnání na částečný úvazek a s úhradou jízdného ve Washingtonu, D.C. v oboru práce v domácnosti bylo v určitém měsíci za 18 dolarů týdně. Toto procento, jak se ukázalo, představovalo ve skutečnosti přesně 2 nabídky z celkových 41. Každý procentní údaj, založený na malém počtu případů, je pravděpodobně zavádějící. Daleko lepší je uvést přímo to číslo. A když je to procento uvedeno s přesností na několik desetinných míst, je na vás, zda to budete považovat za důsledek hlouposti nebo za snahu podvádět.
„Kupte svůj vánoční dárek teď a ušetříte 100 procent,“ radí reklama. Zní to jako nabídka od samotného Santy, ale ukáže se, že je to v podstatě jen záměna základu. Sleva je pouhých 50 procent. Úspora je 100 procent ze snížené, tedy z té nové ceny. To je sice pravda, ale to není to, co slibuje ona reklama.
Je to podobné, jako když prezident Asociace pěstitelů květin řekl v novinovém interview, že „květiny jsou o 100 procent levnější než před čtyřmi měsíci.“ Tím nemyslel, že květináři své zboží nyní rozdávají zdarma. Tak to ale řekl.
Ida M. Tarbell ve své Historii společnosti Standard Oil zašla ještě dál. Řekla, že „snížení cen na jihozápadě … dosahovalo od 14 do 220 procent.“ To by znamenalo, aby prodejci platili kupcům značné obnosyza to, že si tu benzínovou veteš vůbec odvezou.
Deník Hlasatel z Columbusu v Ohiu (Columbus Dispatch) tvrdil, že vyráběný produkt se prodával se ziskem 3.800 procent, což vypočítali z nákladů 1,75 dolaru a prodejní ceny 40 dolarů. Když počítáte procento zisku, máte na výběr několik metod (a měli byste uvést, kterou jste použili). Když je to zisk vůči nákladům, vyšel by v tomto případě ve výši 2.185 procent; vůči prodejní ceně by vyšlo 95,6 procent. Hlasatel použil zřejmě svou vlastní metodu a dospěl – což se zjevně stává velmi často – k přemrštěnému číslu, které zveřejnil.
Dokonce i The New York Times podlehl kouzlu posunutého základu, když publikoval zprávu agentury Associated Press z Indianapolisu:
Deprese dostala dnes pořádnou ránu do brady. Klempíři, štukatéři, tesaři, lakýrníci a další, kteří jsou sdružení v Indianapolisské odborové organizaci stavebnictví, dostali 5 procent zvýšení mezd. Tím se každému z nich vrátila jedna čtvrtina z 20procentního snížení mezd, které je postihlo minulou zimu.
Zní to na první pohled rozumně – ale snížení bylo vypočítáno z jednoho základu – z platu, který ti lidé dostávali původně – zatímco zvýšení vycházelo z menšího základu, totiž z úrovně platu po snížení.
Na tomto příkladu si můžete zkusit statistické posouvání základu, když si pro zjednodušení představíte, že původní mzda byla 1 dolar za hodinu. Snížení o 20 procent znamená, že dostávali 80 centů. Zvýšení této sazby o 5 procent je zvýšení o 4 centy, což není čtvrtina, ale pětina původního snížení.  Jako u tolika dalších, pravděpodobně neúmyslných chyb, i u této se nějak podařilo dojít ke zveličení, které celý příběh vylepšilo.
Z toho všeho vyplývá, že když chcete vyrovnat 50tiprocentí snížení mzdy, musíte tu sníženou mzdu zvednout o 100 procent.
Timesy také jednou napsaly, že za fiskální rok letecká pošta „ztratila kvůli požárům zásilky o váze 4,863 liber, což bylo v procentech pouhých 0,00063 %.“ V článku se psalo, že letadla přepravila za rok celkem 7.715.741 liber pošty. Pojišťovací společnost, která by svoje sazby odvozovala tímto způsobem, by si nadělala spoustu potíží. Přepočítejte si tu ztrátu a zjistíte, že to bylo 0,063 procent čili stokrát víc, než kolik uvedly tyto noviny.
Posunutý základ je také zdrojem iluzí, spojených s dodatečnými slevami. Když obchodník se železářským zbožím zlevní všechno „o 50 % a pak ještě něco o 20% proti ceníku,“ nemyslí tím slevu 70 %. Sleva je 60 %, protože těch dodatečných 20 % se vypočítá z menšího základu, který zbude, když se odečte těch prvních 50 %.
Ke spoustě nesmyslů a podfuků vede také sčítání věcí, které nejdou dohromady, ale vypadají, že dohromady jdou. Děti po generace používaly tuto hříčku v různých formách, aby jim vyšlo, že vlastně vůbec nemusejí do školy.
Třeba si na to vzpomenete. Začneme s 365 dny v roce, od kterých můžeme odečíst 122 dnů jako jednu třetinu času, kterou strávíme v posteli a dalších 45, což jsou 3 hodiny denně, které trávíme tím, že jíme. Ze zbývajících 198 odečteme 90 na letní prázdniny a 21 na Vánoční a Velikonoční prázdniny. Zbývající dny nestačí pokrýt ani soboty a neděle.
Řekli byste, že je to příliš starý a nápadný trik, aby se dal použít ve skutečných záležitostech. Ale odbory zaměstnanců v automobilovém průmyslu ve svém měsíčníku Ammunition trvají na tom, že se to proti nim stále používá.
Tato rozšířená, smutná lež se objeví během každé stávky. Pokaždé, když někde dojde ke stávce, Hospodářská komora oznámí, že ta stávka stojí tolik a tolik milionů dolarů denně.
Získají to číslo tak, že sečtou všechna auta, která by byla vyrobena, kdyby stávkující celou dobu pracovali. Přičtou stejným způsobem ztráty u dodavatelů. Přičtou všechno možné, včetně jízdného v tramvajích a ztráty prodejců.
Podobná a stejně lichá myšlenka, že se procenta dají sčítat tak jednoduše, jako jablka, byla použita proti spisovatelům. Podívejte se, jak přesvědčivě to zní v knižním přehledu The New York Times.
Rozdíl mezi rostoucími cenami knih a příjmy autorů, zdá se, vzniká v důsledku podstatně vyšších výrobních a materiálových nákladů.  Odstavec: dílenské a výrobní výdaje samotné vzrostly za posledních deset let o 10 až 12 procent, materiály jsou dražší o 6 až 9 procent, prodejní a reklamní výdaje vyšplhaly o 10 procent. Dohromady je to zvýšení minimálně o 33 procent (za jednu společnost) a téměř 40 procent pro některá menší vydavatelství.
Ve skutečnosti, pokud každá položka, ze kterých se skládají celkové náklady na vydávání knih, vzrostla zhruba o 5 procent, tak také celkové náklady musely vzrůst zhruba o tolik. Logika, která dovoluje sečíst tato procenta růstu dohromady by otevírala fantastické možnosti. Kupte si dnes dvacet věcí a zjistěte, že každá z nich podražila o pět procent proti loňskému roku. To by se dalo „sečíst“ jako 100 procent a životní náklady by se tedy zdvojnásobily. Nesmysl.
Podobně zní příběh stánkaře, který měl vysvětlit, jak může prodávat králičí sendviče tak levně. „No jo,“ řekl, „musím tam přidat také trochu koňského masa. Já to ale míchám půl na půl: jednoho koně a jednoho králíka.“
Jedna odborářská publikace použila karikaturu, aby protestovala proti jinému typu neoprávněného sčítání. Byl na ní šéf, který sečetl sazbu 1,5 dolaru za normální pracovní hodinu se sazbou 2,25 dolaru za přesčasovou hodinu a sazbu 3 dolary za jednu dvouhodinovku a z toho vypočítal průměrnou hodinovou mzdu 2,25 dolaru. Těžko by se hledal jiný příklad tak nesmyslného průměru.
Další živnou půdou pro obelhávání je záměna mezi procentem a procentním bodem. Kdyby vám zisk v poměru k investicím stoupnul ze 3 procent v jednom roce na 6 procent v dalším roce, můžete to upravit, aby to znělo skromněji a říct, že je to zvýšení o tři procentní body. Stejnou platnost bude mít i výrok, že se jedná o 100procentní zvýšení ziskovosti. Svévolné nakládání s těmito dvěma pojmy nejlépe uvidíte na průzkumech veřejného mínění.
Také percentily jsou záludné. Když vám řeknou, jak si Johnny stojí v porovnání se svými spolužáky v počtech nebo v nějaké jiné schopnosti, to číslo bude nejspíš percentil. Znamená to jeho umístění v každé jednotlivé stovce studentů, jinými slovy jeho umístění přepočtené tak, jako by studentů bylo celkem 100. Ve skupině, kde je dejme tomu 300 studentů, budou tři nejlepší studenti na 99 % percentilu, další tři budou na 98 % a tak dál. To číslo bude zároveň říkat, kolik procent studentů bylo horších než Johny.  Na percentilech je hloupá jedna věc: Student s 99procentním percentilem je zřejmě o trochu lepší než student na 90tiprocentním percentilu, ale dva studenti s výsledky 40 a 60 percentilů mohou být prakticky na stejné úrovni.  Vyplývá to z tendence, kterou má celá řada charakteristik, totiž shlukovat se kolem svého průměru a vytvářet tak onu „normální“ křivku ve tvaru zvonu, kterou jsme zmínili v jedné z předcházejících kapitol.
Čas od času vypukne bitva mezi statistiky, a i zcela prostý pozorovatel musí ucítit, že to zavání. Slušný člověk zpozorní, když se statistikulátoři pustí do sebe. Ocelářský výbor upozornil na některé lumpárny, kterých se dopouštely ocelářské společnosti a ocelářské odbory. Odbory chtěly ukázat, jak dobře šly obchody v roce 1948 (jako důkaz toho, že si společnosti mohou velmi snadno dovolit zvýšení mezd) a tak srovnaly produktivitu v tom roce s produktivitou v roce 1939 – tedy v roce, kdy byla úroveň zvlášť nízká. Společnosti nechtěly být v tomto klání podvodů poraženy a tak trvaly na tom, že srovnání musí být provedeno podle peněz, které zaměstnanci obdrželi a ne podle průměrného hodinového výdělku. Háček byl v tom, že v tom dřívejším roce bylo hodně dělníků zaměstnáno na poloviční úvazek, takže jejich příjmy musely vzrůst, i kdyby se mzdové tarify vůbec nezvýšily.
Časopis Time, uznávaný zejména pro důslednou dokonalost své grafiky, otisknul graf, který je zábavným příkladem toho, jak statistika dokáže vytáhnout z rukávu téměř cokoliv, co je zrovna libo. Když měli na výběr dvě stejně platné metody, z nichž jedna byla příznivá z hlediska ředitelství a druhá z hlediska dělníků, Timejednoduše použil obě. V grafu byly vlastně dva grafy, namalované na sobě. Oba vycházely ze stejných čísel.
Jeden ukazoval mzdy a zisky v miliardách dolarů. Bylo zcela zřejmé, že obojí roste a to o více méně stejný obnos. A že na mzdy šlo zhruba šestkrát víc dolarů než činily zisky. Zdálo se, že nejsilnější inflační tlak přichází z mezd.
Druhá část tohoto duálního grafu vyjadřovala změny jako růst v procentech. Čára mezd byla relativně plochá. Čára zisku mířila strmě vzhůru. Podle ní se dalo odvodit, že hlavním zdrojem inflace byly zisky.
Mohli jste si vybrat, jaký si z toho uděláte závěr. Nebo ještě lépe, mohli jste snadno vidět, že ani jeden prvek nelze spolehlivě označit za viníka. Někdy je podstatnou službou prostě ukázat, že sporná věc není tak jednoznačná, jak se někdo snažil ukázat.
Indexy růstu jsou zásadním ukazatelem pro miliony lidí, neboť se od nich většinou odvozují mzdové tarify. Možná tedy stojí za zmínku, co všechno se s nimi dá udělat, aby skákaly, jak si kdo pískne.
Abychom si to ukázali na co nejjednodušším příkladu, řekněme, že litr mléka stál loni 20 centů a bochník chleba byl za pěticent. Letos je mléko zlevněné na 10 centů a chléb podražil na 10 centů. Tak a teď – co byste chtěli dokázat? Že životní náklady rostou? Nebo že naopak klesají? Nebo že jsou pořád stejné?
Považujme minulý rok za základní období, to znamená že ceny za toto období budou 100 procent. Protože cena mléka od té doby klesla na polovinu (na 50 procent) a cena chleba se zdvojnásobila (na 200 procent) a průměr z 50 a 200 je 125, celkově se ceny zvýšily o 25 procent.
Zkuste to znova a vezměte jako základní období letošní rok. Mléko stálo 200 procent toho, co stojí teď a chleba se prodával za 50 procent proti letošku. Průměr: 125 procent.  Ceny byly o 25 procent vyšší, než jsou teď.
Pokud bychom chtěli dokázat, že se cenová hladina nezměnila vůbec, přejdeme jednoduše na geometrický průměr a použijeme kterékoliv období jako základ.  Je to trochu odlišné od aritmetického průměru, který jsme použili původně, ale je to naprosto legitimní typ čísla a v některých případech nejužitečnější a nejlépe vypovídající. Chcete-li získat geometrický průměr tří čísel, vynásobíte je mezi sebou a vypočítáte třetí odmocninu.  Pokud máte čtyři čísla, pak čtvrtou odmocninu; pro dvě druhou odmocninu. Asi takto:
Vezměte minulý rok jako základ a loňskou cenovou hladinu nazvěte 100 procent. Vy vlastně vynásobíte mezi sebou těch 100 procent za každý druh zboží a vypočítáte odmocninu, která je 100. Pak přejdete k letošnímu roku, kdy je mléko za 50 procent loňské ceny a chléb za 200 procent. Takže 50 násobíte 200 a dostanete 10.000. Druhá odmocnina, což je geometrický průměr, je 100. Ceny nešly ani nahoru ani dolů.
Faktem je, že bez ohledu na matematický základ, je statistika natolik uměním, nakolik je vědou. Velmi mnoho manipulací, a dokonce deformací se dá udělat ve vší slušnosti. Statistik se často musí subjektivně rozhodnout mezi různými metodami a zvolit tu, kterou k prezentaci faktů použije. V komerční praxi je dost nepravděpodobné, že by vybral nevýhodnou metodu, jako by textař těžko nazval výrobek svého sponzora chatrným a levným, když může stejně dobře říct, že je lehký a šetrný.
Dokonce i ve vědecké práci může mít člověk (možná nevědomky) určitý sklon k tomu, aby si přihříval polívčičku. Dá se to dokázat. Z toho vyplývá, že je nutno statistické materiály, fakta a čísla v novinách a v knihách, časopisech a reklamách, podrobit velmi přísnému zkoumání, než kterékoliv z nich přijmeme. Pozorně přimhouřené oko někdy umožní lépe zaostřit. Apriorní odmítání statistických metod nemá také žádný smysl. To je jako odmítat číst, protože spisovatelé někdy používají slova, aby fakta a vztahy spíš utajili než odhalili. Konec konců politický kandidát na Floridě nedávno vytřískal pozoruhodný kapitál, když nařknul svého oponenta, že „praktikuje celibát.“ Majitel kina v New Yorku, který promítá film Quo Vadis použil velká písmena na citát z The New York Times. Tyto noviny totiž nazvaly film „historickou okázalostí.“  A výrobci Crazy Water Crystals, patentovaného léku, psali v reklamách o svém výrobku, že poskytuje „rychlou, krátce trvající úlevu.“
Poznámka Evy Zamrazilové:
Takže pokud jste dočetli až sem, měli byste mít v zásadě jasno, na co vše si dávat pozor. Na výsledky průzkumů, které nemusí být objektivně provedené ani interpretované. Na „průměrné“ hodnoty všeho možného. Na podezřele přesná čísla, na grafy, které jsou příliš přesvědčivé, ale přitom nemají jasnou legendu, měřítko, neuvedou přesné měrné jednotky či zdroj, z něhož tvůrce grafu čerpal. Na tvrzení či dokonce výzkumy potvrzující na základě „statistiky“ nejrůznější souvislosti, aniž by za nimi stál logicky a věcně zdůvodnitelný příběh. Na záměnu příčiny a důsledku, a také na to, jestli je opravdu předmětem zkoumání jev, který je „statisticky“ dokazován. A v neposlední řadě i na slevy : kolik vlastně ušetříte na deklarované slevě? Anebo úpravy platů – je plat, snížený loni o 10% a zvýšený letos o 10% opět stejný jako před úpravou? Chce to jen trochu přemýšlení, abychom zjistili, že stejný není, že se snižoval vyšší plat a tento snížený se pak zvyšoval. Nejde tedy o stejných 10 % – pokaždé je to jiná peněžní částka.
Nebylo by špatné, kdyby se pro manipulace se statistickými údaji nalezl a vžil výraz jako statistikulace, statistipulace nebo třeba manipulistika, o což se autor snaží. Mnohé z toho, co se na nás denně valí z médií a z Internetu se sice tváří jako statistika, ale ve své podstatě je to statistikulace. A je celkem jedno, jestli se jí dopustil “nevinný břídil“ nebo „lstivý manipulátor“.
Autor knihy se snažil především podnítit ve čtenářích základní instinkty kritického myšlení, V řadě případů poukázal na to, jak optiku trochu pootočit – kdo nosí brýle zná ze zkušenosti u optika, že často stačí jen pootočit sklíčkem a hned se nám rozjasní. Nevěřit bez rozmyslu, všemu, co je nám předkládáno pod pláštíkem „nezpochybnitelně vědecké odbornosti“ a nezapomenout používat zdravý rozum. V poslední kapitole nám autor ještě jednou a tentokrát systematicky zrekapituluje, které základní otázky bychom si jako statisticky gramotní občané měli pokládat.
Poznámka ČSÚ – Tereza Košťáková, Petr Musil
Devátou kapitolu můžeme vnímat jako shrnutí úmyslných či neúmyslných chyb, které vedou ke klamání uživatelů statistiky. Některé chyby byly podrobněji popsány v předchozích kapitolách a rovněž jsme se k nim vyjadřovali ve svých komentářích. Téma posuvných základů a výpočtu procent stojí za hlubší zamyšlení. D. Huff uvádí řadu někdy i těžko uvěřitelných příkladů nesprávných anebo zavádějících výpočtů. Ovšem tato problematika skýtá jistá interpretační úskalí, i pokud jsou výpočty korektní.
Meziroční indexy jsou u uživatelů populární, neboť si je lze na rozdíl od bazických indexů, které se vztahují k průměru často velmi vzdáleného roku (např. k průměru roku 2015), dobře představit. Jde prostě o srovnání vůči stejnému období předchozího roku (např. srovnáváme 1. čtvrtletí 2022 s 1. čtvrtletím 2021). S každým dalším měsícem nebo čtvrtletím dochází k posunu základu, což musí mít uživatelé na paměti a vzpomenout si, co se dělo ve stejném období předchozího roku. Například, že meziroční index HDP byl v 2. čtvrtletí 2021 významně ovlivněn uzávěrou ekonomiky ve 2. čtvrtletí 2020 (čili tím, co se dělo o rok dříve). V publikacích ČSÚ bývají obvykle v takových případech uživatelé upozorněni na tzv. „efekt základny“, čili na mimořádnosti ovlivňující období, s nímž se srovnání provádí. Je to přece jen již rok a ne každý má v paměti, co se tehdy dělo.
Na tzv. „efekt základny“ je nutné pamatovat vždy, bez ohledu na to, zda jde o meziroční, meziměsíční nebo mezičtvrtletní (či jakýkoliv jiný) index. Připomeňme na tomto místě ještě jednu důležitou skutečnost, na kterou se občas při práci s meziměsíčními či mezičtvrtletními indexy zapomíná: aby bylo možné provádět takové srovnání, musí se u většiny statistik používat sezónně očištěná data.
Nedávalo by smysl porovnávat „jarní“ čtvrtletí se „zimním“ čtvrtletím (tj. se „zimní“ základnou), pokud by nebyl vliv specifických odlišností sezón eliminován. A připomeňme ještě dva příklady, které dokreslují zdánlivé záludnosti posuvných základen, které však vychází jen z běžně známých skutečností při práci s procenty. Jestliže například ekonomika v jistém období klesne o 10 % (oproti původní základně), tak pokud by se měla ekonomika dostat na původní úroveň, musí v následujícím období vzrůst o 11,1 %, neboť tento následný růst se již počítá z nového (nižšího) základu.
Poslední příklad, který zde uvedeme, připomíná, že je sice důležité mít na paměti, co se dělo před rokem, ovšem nesmíme zapomínat ani na sledování toho, co se dělo v průběhu celého roku.
Neobvyklý vývoj v průběhu roku totiž může vést k na první pohled nekonzistentním výsledkům. K tomu došlo například v lednu 2010, kdy byla cenová hladina měřená indexem spotřebitelských cen vyšší meziročně o 0,7 % a meziměsíčně o 1,2 %. Nižší meziroční než meziměsíční index spotřebitelských cen není obvyklý, ale má vždy logické vysvětlení. V průběhu roku 2009 totiž cenová hladina klesala, a proto byl v konečném důsledku meziroční index nižší (tj. srovnání ledna 2010 oproti lednu 2009) než meziměsíční index (tj. srovnání ledna 2010 oproti prosinci 2009).
Foto: redakce EM
Zdroj: Darrell Huff
Desátá kapitola vychází už 26. 4. 2022
[1] O spisovateli Louisi Bromfieldovi se říká, že má pro kritiky univerzální odpověď, kterou rozesílá, když mu přijde příliš mnoho dopisů, které nestihne vyřizovat individuálně. Tou větou nic nepřipustí, nikoho nevyzve k další korespondenci, ale zatím s ní téměř každého uspokojil. Ta klíčová věta zní: „Na tom, co říkáte, možná něco bude.“
To mi připomíná kněze, který ve své kongregaci dosáhl velké popularity u maminek lichotivými poznámkami o dětech, které mu přinesly ke křtu. Když si pak ale maminky vyměňovaly své postřehy, žádná si nemohla vzpomenout, co ten člověk říkal. Věděly jen, že to bylo „něco milého“. Ukázalo se, že stále jen opakoval: „Bože! (rozzářil se) „To je dítě, není-liž pravda!“
[2] Russell Sage Foundation založila Margaret Olivia Sage v roce 1907 na památku svého manžela Russella, který byl ředitelem železnic. Nadace podporuje rozvoj sociálních věd s cílem lépe porozumět společenským problémům na trhu práce, problémům, spojeným s imigrací, etnickou příslušností a sociální nerovností v USA věnuje pozornost také behaviorální ekonomii.


Sdílet
Hodnotit
1 Star2 Stars3 Stars4 Stars5 Stars

Doporučujeme

Jak lhát se statistikou: Jak statistikulovat (Kapitola 9 )

19.04.2022, Autor: Laura Feketeová

Dezinformování veřejnosti s využitím statistických materiálů se dá považovat za manipulaci; mohlo by se to také nazývat statistikulace (i když to slovo není moc pěkné). Podle názvu této knížky a některých příkladů, které jsou v ní uvedené, by se mohlo zdát, že cílem všech takových postupů je klamat.

Sazka reklama
e-news.cz - kurzy
e-news.cz - kurzy
e-news.cz - kurzy
e-news.cz - kurzy
e-news.cz - kurzy
e-news.cz - kurzy
Apogeo
Reklama

Jak lhát se statistikou: Napřed důsledek, potom příčina (Kapitola 8)

12.04.2022, Autor: Laura Feketeová

Jednou si někdo pořádně nadrobil, když zjišťoval, zda mají kuřáci ve škole horší známky než nekuřáci. Ukázalo se, že mají. To potěšilo spoustu lidí, kteří s tím potom pracovali, jak jen se dalo. Vzniknul dojem, že přestat s kouřením je cesta, jak dosáhnout lepších známek; a – když to domyslíme dál - že kouření otupuje mysl.

Jak lhát se statistikou - Exkluzivně na EM

31.03.2022, Autor: Laura Feketeová

Nejprodávanější kniha o statistice s exkluzivními poznámkami ČSÚ. Kniha, kterou již v češtině nikde neseženete. Výstižné komentáře doc.

e-news.cz - kurzy
e-news.cz - kurzy
e-news.cz - kurzy
Apogeo
e-news.cz - kurzy
e-news.cz - kurzy
Sazka reklama
e-news.cz - kurzy
Reklama

Jak lhát se statistikou: Obrázkové grafy (Kapitola 6)

29.03.2022, Autor: Laura Feketeová

Zhruba před deseti lety se hodně psalo o obyčejných lidech, čímž jsme byli míněni my všichni. Když to začalo znít příliš povýšenecky, stali se z nás tzv. běžní lidé. Brzo se ale vytratil i tento pojem a snad je to tak i dobře. Onen obyčejný člověk je ale pořád mezi námi. Je to postavička na grafech.

Jak lhát se statistikou: Graf, který má šmrnc (Kapitola 5)

22.03.2022, Autor: Laura Feketeová

Z čísel jde strach. Sebedůvěru Humptyho Dumptyho, který tvrdí Alence v říši divů, že je pánem slov, která užívá, by asi většina lidí na čísla nerozšířila. Možná máme trauma, které v nás zanechala aritmetika už na základní škole.

e-news.cz - kurzy
e-news.cz - kurzy
e-news.cz - kurzy
e-news.cz - kurzy
Sazka reklama
e-news.cz - kurzy
Apogeo
e-news.cz - kurzy
Reklama

Jak lhát se statistikou: Když chybí vysvětlivky (Kapitola 3)

08.03.2022, Autor: Laura Feketeová

„Uživatelé hlásí o 23 % méně zubního kazu při použití zubní pasty Doakes“, hlásá velký nápis. Mohli byste mít o 23 % méně bolesti, tak čtete dál. S uspokojením zjistíte, že tyto výsledky pocházejí z „nezávislé“ laboratoře a jsou potvrzené „certifikovaným“ znalcem. Co víc byste chtěli?

Jak lhát se statistikou: Co průměr zatajuje (Kapitola 2)

01.03.2022, Autor: Laura Feketeová

​Předpokládám, že nejste žádný snob a ujišťuji vás, že já nepodnikám v realitách. Na chvíli si ale představme, že jste snob a že já v realitách podnikám. Navíc si představíme, že hledáte nějakou nemovitost, kterou byste koupil a která aby nebyla daleko od kalifornského údolí, kde já bydlím.

e-news.cz - kurzy
e-news.cz - kurzy
Apogeo
e-news.cz - kurzy
e-news.cz - kurzy
e-news.cz - kurzy
e-news.cz - kurzy
Sazka reklama
Reklama