e-news.cz - kurzy
Reklama

Jak lhát se statistikou: Polovičatá čísla (Čísla, kterým něco chybí) (Kapitola 7)

05.04.2022, Autor: Laura Feketeová

1 vote, average: 1,00 out of 51 vote, average: 1,00 out of 51 vote, average: 1,00 out of 51 vote, average: 1,00 out of 51 vote, average: 1,00 out of 5
Jak lhát se statistikou: Polovičatá čísla (Čísla, kterým něco chybí) (Kapitola 7)

Když chcete něco dokázat a nejde to, ukažte něco jiného a tvařte se, že je to to samé. V tom zmatku, který nastane, když se lidská mysl střetně se statistikou, si ten rozdíl sotva někdo uvědomí. Polovičaté číslo je nástroj, který se vám zaručeně hodí. Vždycky se hodilo.


Nemůžete prokázat, že vaše medicína léčí nachlazení, můžete ale zveřejnit (velkými písmeny) místopřísežné prohlášení laboratoře, že půl unce toho vašeho léku zničilo ve zkumavce během jedenácti vteřin 31,108 bakterií. Když už jste v tom, tak se ujistěte, že ta laboratoř je renomovaná nebo má alespoň působivý název. Otiskněte tu zprávu v plném znění. Vyfotografujte fešáka v bílém plášti, který bude vypadat jako doktor a fotku umístěte vedle zprávy.
Nezmiňujte se ale o tom, co je za tou vaší povídačkou ukryté. Není přece na vás – nebo snad je? – abyste upozorňovali, že dezinfekce, která dobře funguje ve zkumavce, nemusí stejně fungovat i v lidském hrdle, zvlášť když byla podle návodu zředěna, aby v krku nepoškodila tkáně. Nekomplikujte své sdělení výkladem, jaké bakterie jste vlastně ničili. Kdo ví, jaké bakterie způsobují nachlazení? Obzvlášť, když to možná ani bakterie nejsou?
Ve skutečnosti není prokázáno žádné spojení mezi různými druhy bakterií ve zkumavce a kdo-ví-čím, co způsobuje nachlazení. Lidé ale nemají chuť to podrobně zkoumat, zejména, když jim teče z nosu.
Možná je tento postup přece jen příliš nápadný a lidé by se mohli začít vyptávat, i když v reklamách by jejich zvídavost nemělo probouzet nic. Každopádně existuje rafinovanější verze.
Řekněme, že v období, kdy rostou rasové předsudky, máte za úkol „prokázat“ opak. Není to nijak složitý úkol. Uspořádejte průzkum – nebo ještě lépe – nechte si udělat průzkum od nějaké renomované organizace. Ptejte se obvyklého vzorku populace, zda si myslí, že barevní lidé mají stejnou šanci získat práci jako bílí. Opakujte tento průzkum v takových intervalech, abyste mohli zachytit trend.
Princetonský Úřad pro výzkum veřejného mínění tento problém kdysi zkoumal. Výsledek ukázal, že v průzkumech veřejného mínění nejsou věci vždy takové, jaké se jeví. Každá osoba, které byla položena otázka ohledně pracovních příležitostí, zodpověděla ještě několik dalších otázek formulovaných tak, aby se ukázalo, zda nemá silné předsudky vůči barevným. Ukázalo se, že lidé s nejsilnějšími předsudky nejčastěji odpovídali, že barevní mají na práci stejnou šanci, jako bílí. (Dohromady téměř dvě třetiny lidí, kteří měli vůči barevným sympatie, si nemyslely, že barevní mají stejně dobré šance získat práci jako bílí a zhruba dvě třetiny těch, kteří projevovali určité předsudky řeklo naopak, že barevní a bílí stejné možnosti mají.)  Bylo naprosto jasné, že z tohoto výzkumu se dozvíte o podmínkách zaměstnávání barevných jen velmi málo. Zato byste se mohli dozvědět mnoho zajímavého o postojích lidí k rasovým otázkám.
Tady vidíte, že pokud v době průzkumu veřejného mínění předsudky zesilují, bude přibývat i odpovědí, že barevní mají stejné šance na práci jako bílí. Takže ohlásíte své výsledky: Průzkum ukazuje, že černí mají po celou dobu férovější zacházení.

Zdroj: Irving Geis

Uplatnili jste velmi obezřetně polovičaté číslo a dosáhli jste s ním pozoruhodného výsledku.  Čím horší je skutečnost, tím lépe to podle vašeho průzkumu vypadá.
Nebo si vezměte tento příklad: „27 procent velkého vzorku významných lékařů kouří Hrdlovky – dávají jim přednost před všemi ostatními značkami.“ To číslo je samozřejmě už samo o sobě podezřelé z mnoha hledisek, ale to nehraje roli. Jedinou reakcí na tak irelevantní číslo může být otázka „No a co?“ S veškerou úctou k lékařskému povolání – vědí lékaři něco víc o tabákových značkách než vy? Mají nějaké vnitřní „insider“ informace, které jim umožňují zvolit mezi cigaretami tu nejméně škodlivou? Samozřejmě, že nemají a váš doktor bude první, který vám to potvrdí. Přesto těch „27 procent“ má přecejen určitý zvuk, jako by to něco znamenalo.
Teď jedno procento ubereme a zamyslíme se nad případem odšťavovače. Velká reklama na tento přístroj tvrdí, že „získává o 26 % více šťávy“ jak bylo „prokázáno laboratorním testem“ a „potvrzeno Institutem dobré péče o domácnost.“
Zní to opravdu dobře. Jestli se dá koupit odšťavovač, který je o 26% účinnější, proč kupovat jiný typ? Tak dobře. Aniž bychom rozebírali tvrzení, že „laboratorní testy“ (zejména „nezávislé laboratorní testy“) prokázaly něco tak proklatě nejasného, podívejme se, co ten údaj vlastně znamená? O 26 % více než co?  Když to z nich nakonec vymáčkli zjistilo se pouze, že tento odšťavovač srovnávali s ručním vymačkávačem na citróny. Nemělo to absolutně nic společného s údaji, které byste bývali chtěli mít před koupí; tento odšťavovač mohl být tím nejslabším na trhu. Kromě toho, že je ten údaj podezřele přesný, je to číslo 26% totálně irelevantní.
Autoři reklam nejsou jediní, kteří vás ošidí čísly, když se necháte. Článek o bezpečné jízdě, otištěný v časopise This Week, byl jistě napsán ve snaze pečovat co nejlépe o vaše zájmy. Psalo se tu, co se může stát, když se „budete řítit po dálnici rychlostí 70 mil za hodinu a budete kličkovat ze strany na stranu.“ Pokud to bude v 7 hodin ráno, psalo se v tom článku, měli byste čtyřikrát větší šanci na přežití, než kdyby bylo sedm hodin večer. Důkaz: „Na dálnicích se stane čtyřikrát víc smrtelných nehod v 7 večer než v 7 ráno.“ Je to sice přibližně pravda, ale chybí tomu závěr. Večer se na dálnicích zabije víc lidí než poránu jednoduše proto, protože večer je na dálnicích celkově víc lidí než poránu. Vy jako jednotlivý řidič, můžete být večer možná víc ohrožen, ale v těch číslech není nic, co by to v jakémkoliv ohledu dokazovalo.

Zdroj: Irving Geis

Na základě stejného nesmyslu, který použil autor zmíněného článku, můžete dokázat, že jasné počasí je nebezpečnější než mlha. Za jasného počasí se stane víc dopravních nehod, protože jasné počasí je častěji než mlha. Současně ale může být jízda v mlze daleko nebezpečnější.
Když si vezmete statistiky nehodovosti a podíváte se na jednotlivé druhy dopravy, může vás to k smrti vyděsit … dokud si nevšimnete, jak uboze jsou ta čísla popsaná, tedy jak neúnosně „polovičatá“ čísla to vlastně jsou.
Loni zemřelo při leteckých neštěstích daleko více lidí než v roce 1910. Jsou proto moderní letadla nebezpečnější? Nesmysl. Dnes létá několik setkrát víc lidí než tehdy, to je celé.
Byla zveřejněna zpráva, že za jeden nedávný rok umřelo v důsledku parní dráhy 4.712 lidí. To zní jako dobrý argument, aby se člověk držel od vlaků dál, třeba aby zůstal víc věrný svému automobilu. Když ale začnete pátrat, co je to vlastně za číslo, zjistíte, že to znamená něco docela jiného. Téměř polovina těchto obětí byli lidé, jejichž automobil se střetnul s vlakem na přejezdu. Podstatná část toho zbytku byli černí pasažéři, kteří se vezli na podvozku pod vagónem. Pouze 132 z celkových 4.712 zemřelých byli cestující ve vlacích. A dokonce ani s tímto číslem nemůžete nic pořádně porovnat, dokud nemáte jasně dán celkový počet mil, které cestující ve vlacích najezdili.
Když chcete zjistit, jakou máte šanci, že se zabijete na výletě napříč Spojenými státy od pobřeží k pobřeží, nemůžete se ptát, kde zemřelo loni nejvíc lidí, jestli ve vlacích, v letadlech nebo v autech. To byste žádné relevantní informace nedostali. Zjistěte si míru úmrtnosti, což je počet smrtelných nehod na každý milion kilometrů přepravy cestujících. To vám spíš napoví, kde jsou pro vás největší rizika.
Existuje řada dalších způsobů, jak něco spočítat, a pak to prezentovat v úplně jiné souvislosti. Základní metoda spočívá v tom, že se vyberou dvě věci, které vypadají jako stejné, i když stejné nejsou. Jste třeba personální šéf ve firmě, kterou trápí odbory. Tak si „uděláte průzkum“ mezi zaměstnanci, abyste zjistili, kolik z nich si na odbory stěžuje. Pokud ta odborová organizace není spolkem andělů s archandělem v čele, můžete se ptát a zaznamenávat naprosto poctivě, a pak vyjít s důkazem, že větší část zaměstnanců si na něco stěžuje. Vydáte svou informaci jako zprávu, že „naprostá většina – 78 procent – je proti odborům.“ Co jste opravdu udělali je, že jste sečetli hromadu všemožných stížností a drobných výhrad a ten součet jste nazvali jinak. Zní to ale, jako by to bylo správně. Vy jste tu věc nedokázali, ale zní to, jako byste ji dokázali, že?
Ono to však určitým způsobem poctivé je. Odbory mohou celkem pohotově „dokázat“, že prakticky všechny výhrady dělníků se týkají toho, jak je továrna řízena.
Pokud byste se chtěli vydat na lov těchto polovičatých čísel, zkuste si projít finanční závěrky korporací. Všímejte si zisků, které by mohly vypadat jako příliš velké, a proto jsou ukryty pod jinými jmény. Časopis Svazu pracujících v automobilovém průmyslu nazvaný Munice popisuje tento postup takto:
Účetní závěrka říká, že společnost vytvořila v loňském roce zisk 35 milionů dolarů. To je 1,5 centu z každého dolaru za prodané zboží. Takové společnosti je vám líto. Na záchodě praskne žárovka. Na její výměnu musí společnost vynaložit 30 centů. Když je to tak, spolkne to zisk z 20 dolarů tržeb za zboží. Člověk pak začne šetřit i s papírovými ručníky.
Ale samozřejmě, o čem společnost informuje jako o zisku je jen polovina nebo třetina skutečného zisku.  Část, o které účetní závěrka neinformuje, je skrytá v amortizaci a zvláštních odpisech a v rezervách na nepředvídatelné výdaje.
Stejní hoši si umí pohrát také s procenty. General Motors mohly za posledních devět měsíců ohlásit poměrně skromný zisk (po zdanění) ve výši 12,6 % z tržeb. Ale za to samé časové období byl zisk GM v poměru k investicím 44,8 %, což zní o hodně hůř … nebo lépe, podle toho, co tím chcete dosáhnout.
Obdobně musel čtenář časopisu Harper’s začít obhajovat supermarkety A&P, když se v rubrice čtenářských dopisů dočetl, jak nízký mají čístý zisk: pouhých 1,1% z tržeb. Položil si otázku: Mohl by být kdokoliv z americký občanů veřejně ostouzen za hrabivost … kdyby získával jen něco málo přes 10 dolarů z každého 1000 dolarů, které během roku vynaloží, tedy investuje?”
Na první pohled vypadá těch 1,1 % téměř zoufale málo.  Porovnejte to se 4 nebo 6 nebo i více procenty úroků, které většinou známe ze státních hypoték FHA[1], bankovních půjček a podobně. Nebyli by na tom A&P lépe, kdyby odešli z potravinářského obchodu a vložili svůj kapitál do banky a žili z úroků?
Háček je v tom, že roční výnos z investic není stejná ošatka vajec jako výnosy z celkových tržeb. V dalším vydání Harper’s na to napsal jiný čtenář tuto reakci: „Když budu nakupovat jeden druh zboží každé ráno za 99 centů a prodám ho vždy odpoledne po jednom dolaru, dosáhnu sice jen 1% výnosů z celkových tržeb, ale 365 procent z investovaných peněz za rok.“
Často existuje víc způsobů, jak popsat jeden určitý údaj. Můžete například vyjádřit naprosto stejnou skutečnost, když ji jednou pojmenujete jako výnos ve výši 1 % z tržeb, nebo jako 15tiprocentní výnos z investic nebo jako zisk 10 milionů dolarů, či jako zvýšení zisku o 40 % (v porovnání s průměrem let 1935-39), nebo jako snížení o 60% proti loňskému roku. Podstatou je zvolit takovou formulaci, která zní nejlépe s ohledem na účel, ke kterému má posloužit. Nu a pak se musíte spolehnout, že jen málo z těch, kteří to budou číst, pochopí, nakolik to odráží skutečnou situaci.
Ne všechna polovičatá čísla jsou výsledkem záměrného klamání. Mnohé statistiky, včetně lékařských, které jsou pro každého z nás velmi důležité, jsou deformované už přímo u zdroje tím, že sama výchozí informace je nejasná. Kupodivu i údaje o tak choulostivých věcech, jako jsou potraty, nemanželské porody a syfilis si navzájem odporují. Když se podíváte na nejnovější dosažitelná čísla o chřipce a zápalu plic, dojdete k pozoruhodnému závěru, že tato onemocnění se prakticky vyskytují jen ve třech jižních státech USA. V nich je hlášeno až 80 % všech případů. Toto procento však ve skutečnosti vyjadřuje pouze ten fakt, že tyto tři státy vyžadovaly hlášení o onemocněních, zatím co ostatní státy s tím přestaly.
Stejně malou vypovídací schopnost mají čísla o výskytu malárie. Zatímco před rokem 1940 byly na Americkém Jihu stovky tisíc případů ročně, dnes je jich tam jen pár. Dalo by se z toho usuzovat na zdraví prospěšnou a zřejmě důležitou změnu, která se odehrála jen během několika málo let. Jenomže jediné, co se ve skutečnosti stalo je to, že se teď nově hlásí pouze případy, u kterých se potvrdilo, že jde o malárii. Původně se to slovo „malárie“ používalo na většině Jihu jako hovorový výraz pro nachlazení, zimnici či třesavku.
Úmrtnost u námořnictva během Španělsko – Americké války byla devět z tisíce.  U civilního obyvatelstva v New York City to bylo během stejného období šestnáct z tisíce. Námořní verbíři používali později tento údaj, aby ukázali, že je bezpečnější být u námořnictva než mimo ně. Předpokládejme, že tato čísla jsou přesná, což nejspíš byla. Na chvíli se zastavme a zkusme odhalit, proč jsou ta čísla prakticky nesmyslná nebo alespoň proč jsou nesmyslné ty závěry, které z nich verbíři dělali.
Obě skupiny nejsou srovnatelné. Námořnictvo se skládá zejména z mladých mužů s prověřeným, dobrým zdravím. Civilní obyvatelstvo zahrnuje děti, staré lidi a nemocné. Všechny, jejichž úmrtnost je vyšší, ať jsou kdekoliv. Tato čísla rozhodně nedokazují, že člověk, který splňuje normy námořnictva bude žít déle u námořnictva než mimo ně. Nedokazují ani opak.
Možná jste slyšeli tu neradostnou zprávu, že rok 1952 byl z hlediska obrny nejhorším rokem ve zdravotnické historii. Tento závěr byl založen na takových důkazech, že by si snad nikdo nemohl přát lepší: v tom roce bylo totiž zaznamenáno daleko víc případů obrny než kdykoliv dříve.
Když se ale odborníci podívali na ta čísla pozorněji, zjistili pár věcí, které byly poněkud radostnější. Jednou takovou věcí bylo to, že v tom roce 1952 bylo velmi mnoho dětí ve věku, kdy jsou nejnáchylnější onemocnět obrnou, takže výskyt by musel být rekordní, i kdyby míra onemocnění zůstala na stejné úrovni. Další věcí bylo to, že všeobecné povědomí o obrně vedlo k častější diagnostice a k hlášení i mírnějších případů. Nu a konečně tu byla vyšší finanční pobídka, více pojištění proti obrně a víc dotací, dostupných z Národní nadace pro dětská ochrnutí. Toto vše vrhlo závažné pochybnosti na názor, že obrna dosáhla nového rekordu a celkový počet úmrtí tyto pochybnosti následně potvrdil.
Pozoruhodným faktem je, že míra úmrtnosti nebo počet úmrtí jsou často lepšími měřítky výskytu určitého onemocnění než přímo čísla o výskytu této nemoci samé – prostě z toho důvodu, že kvalita hlášení a vedení záznamů je v případě úmrtí mnohem vyšší. V tomto případě číslo, o kterém víme, že daný jev necharakterizuje úplně výstižně a je tedy „polovičaté“, může mít větší význam než údaj, který z tohoto úhlu pohledu jako polovičatý vůbec nevypadá.
Polovičatá čísla bují v Americe každý čtvrtý rok. To neznamená, že tato čísla jsou ve své podstatě cyklická. Znamená to pouze, že přišel čas volebních kampaní.  Republikánská strana vstoupila do kampaně v říjnu 1948 s prohlášením, postaveným na údajích, o nichž byste řekli, že se navzájem perfektně objasňují a doplňují. Tak tomu ale nebylo:
Když byl Dewey zvolen guvernérem v roce 1942, byl minimální plat učitele v některých okresech kolem pouhých 900 dolarů za rok.  Dnes si učitelé ve školách státu New York užívají nejvyšší platy na světě. Na základě doporučení guvernéra Deweye, které vycházelo ze zjistění Výboru, který vytvořil, poskytla legislativa v roce 1947 ze státního přebytku 32 miliony dolarů na okamžité zvýšení platů učitelů ve školách. Výsledkem je, že minimální platy učitelů v New York City se pohybují mezi 2.500 až 5.325 dolary.
Je docela dobře možné, že se pan Dewey projevil jako přítel učitelů, ale tato čísla to nedokazují. Je to starý trik typu „předtím-a-potom“, v nichž se neuvedené faktory prezentují tak, aby budily dojem něčeho, čím ve skutečnosti nejsou. Máte tady „předtím“ 900 dolarů a „potom“ 2.500 až 5.325 dolarů, což zní opravdu jako zlepšení. Jenomže to malé číslo je nejnižší mzda v nějakém venkovském okrese a to velké je rozpětí v samotném městě New York. Za guvernéra Deweye mohlo nastat určité zlepšení, ale také nemuselo.
Toto prohlášení představuje statistickou formu fotografií „před-a-po“, které je důvěrně známým trikem v časopisech a v reklamách. Obývací pokoj je vyfotografován dvakrát, abyste viděli, jaké obrovské zlepšení může způsobit nátěr novou barvou. Ale mezi těmi dvěma snímky se přidal nový nábytek a někdy je ten obrázek „předtím“ maličký, spoře osvětlený a černobílý a ta verze „potom“ je velká fotografie, plně barevná.  Nebo vám dva obrázky ukazují, co se stalo, když dívka začala používat přeliv na vlasy. Panečku, ona potom vypadá daleko líp.  Jenomže podstatná část té změny, kterou uvidíte, když se podíváte pozorněji, byla vytvořena tím, že ji přemluvili, aby se usmála a hodili trochu zadního světla na její vlasy. Větší pochvalu, než přeliv, zaslouží fotograf.
Poznámka Evy Zamrazilové: 
V originále nadepsal autor tuto kapitolu   “Semiattached figures”, což je tak trochu překladatelský oříšek. V angličtině je běžným pojmem „semidetached house“, což je na rozdíl od „detached house“, tedy samostatného domku, nám dobře známý „dvojdomek“, který sdílí jednu stěnu se sousedem. Je tedy z definice levnější, ale té dražší, samostatné variantě bydlení se chce tak trochu podobat – je tedy „semi-detached“, aby to bylo jasné. „Bydlíme v „semi- … „je běžný britský pojem užívaný obyvateli dvojdomků. Lze se domnívat, že autor vytvořil vtipnou slovní hříčku a výrazem “semiattached” vyjádřil onu částečnou či vágní spojitost jevů, popisovaných takovými čísly. Zatímco domky se společnou stěnou jsou „polo-oddělené“ (polo-samostatné, tedy semi-detached), „Semiattached figures“, (polo-spojená čísla) jsou taková, která sice určitý vztah nebo vazbu naznačují, ale jen velmi okrajově. Autor věnoval vysvětlení tohoto problému celou kapitolu, kterou jste právě přečetli – víte tedy docela jistě, o co běží.  Za nejvýstižnější překlad do češtiny jsme po určitou dobu považovali pojem “polojasná čísla”, což je ovšem trochu zavádějící, protože v češtině bývá polojasné pouze počasí a když řekneme, že je polojasno, víme docela přesně, jak je. Proto jsme nakonec zvolili “polovičatá čísla”, tedy taková, která sice něco říkají, ale jen zčásti, jaksi napolovic.
Dlužno podotkout, že pojem “semiattached figure” se stále běžně používá k označení zavádějících statistických údajů. Zadejte jej do vyhledávače na internetu a spolehlivě Vás zavede k originálu této knihy a k příkladům závadných statistik. Třeba k němu najdete ještě lepší český ekvivalent, než je v tomto vydání (dejte vědět autorovi překladu!).
Moderní autoři nazývají obdobné postupy “mutant statistics”. Česky bych možná řekla “klonování statistiky”. Jsou to případy, kdy se něco celkem korektně spočítá, ovšem z nesprávně shromážděných dat a pak se to nepodloženým způsobem interpretuje. Typickým případem jsou internetová hlasování rozhlasových stanic nebo ankety po telefonu. Účastníci ankety se vybírají sami. Většinou jsou to lidé, kteří se chtějí zúčastnit a chtějí svým hlasováním ovlivnit výsledek. Nelze tedy na základě takové ankety říct, že “80 % Čechů …”, ani, že “80 % našich posluchačů …”, ale jen a pouze, že “80 % účastníků naší ankety …” sdílí nějaký názor.
Klonované jsou nejspíš také údaje, publikované v souvislosti s potíráním různých nešvarů. Píše se například, že v důsledku kouření u nás umírá ročně 23.000 lidí, na obezitu 10.000, na nadměrnou konzumaci alkoholu 6.000.  Když se nad tím zamyslíte – jak lze zjistit úmrtí v důsledku kouření nebo konzumace alkoholu? Lékař vyplňuje hlavní příčinu úmrtí do LPZ (List o prohlídce zemřelého) a tento údaj se pak z matriky dostane do ČSÚ. Tady se sleduje celkem 20 diagnóz, ale ani jednou z nich není kouření nebo pití alkoholu. Údaje jsou tedy nejspíš klonované: úmrtí v důsledku chorob, které souvisejí s těmito škodlivými zvyky, se prostě nazvou trochu jinak. Na choroby, které se obecně spojují s kouřením či s alkoholem, umírají ovšem i nekuřáci a abstinenti a naopak – mnohý kuřák zemře při dopravní nehodě nebo v důsledku vrozené vady. Kuřák i alkoholík se může dožít vysokého věku a nezřídka může být jeden člověk kuřákem i alkoholíkem. Budeme úmrtí kuřáka, který se dožil 90ti let považovat za úmrtí v důsledku kouření? Jestli si k fajfce dával ještě štampli, zařadíme ho mezi 23.000 zemřelých kuřáků nebo mezi 6.000 zemřelých alkoholíků? A pokud zemřel při dopravní nehodě, není to všechno trochu na vodě? Mimochodem – jak se pro statistické účely zjistí, že je někdo kuřák či alkoholík? Kolik musí vypít a vykouřit, abychom jej statisticky zachytili? Jediná rozumná metoda je zkoumání vzorku populace a to formou dotazu. Sám respondent tedy o sobě musí prohlásit, že kouří či pije alkohol a musí odhadnout svou denní spotřebu. Z těchto průzkumů vyplývá, že zhruba 24 % populace ve věku 15+ u nás kouří. Statistik by rovněž provedl intervalový odhad a řekl, že s 95%ní pravděpodobností u nás kouří 19 – 29 % obyvatel starších 15 let. Genetické inženýrství ve statistice však místo toho usoudí, že když u nás umírá ročně kolem 100 tisíce lidí, čtvrtina z nich budou jistě kuřáci a protože ani kuřáci neumírají jen v důsledku kouření, číslo se trochu zmenší. V médiích pak najdete, že v přímé souvislosti s kouřením u nás umírá 18 tisíc, ale také i těch zmíněných 23 tisíc lidí ročně.  Jsou tedy počty úmrtí v důsledku kouření nebo pití alkoholu skutečnými statistikami? Nezdá se. Jsou to zřejmé klony, byť publikované v zájmu dobré věci. Účel ovšem prostředky nesvětí a sebelepší úmysly nemohou zakalit zdravý rozum.
Poznámka ČSÚ – Tereza Košťáková, Petr Musil
Huff a E. Zamrazilová se v této kapitole dotýkají problému, který je bohužel poměrně častý. Ať vědomě nebo nevědomě: pro podložení svých tvrzení často autoři používají čísla, která pouze zdánlivě s daným tématem souvisí, anebo dokonce o zkoumaném problému vůbec nevypovídají. Nic na tom nezmění ani fakt, že samotné použité údaje mohou být kvalitními statistickými údaji z dílny renomovaných institucí.
Tohoto tématu jsme se už dotkli v kapitole 5, říká se tomu tzv. adekvační problém ve statistice (tj. jak moc je „adekvátní“ použít jistý ukazatel při zkoumání daného jevu). Samozřejmě pokud daný ukazatel vůbec o daném jevu nevypovídá, pak není co řešit. Tyto extrémy odložme stranou a zaměřme se spíš na případy, kdy spolu ukazatel a jev souvisí alespoň nepřímo či s jistým omezením (o kterém by měl čtenář samozřejmě vědět). Jedna věc totiž zatím nezazněla: statistika, a obzvlášť ta ekonomická či sociální, je kompromisem možného – a zejména je kompromisem mezi včasností, podrobností a přesností. Pokud chceme mít ukazatele k dispozici rychle, pak musíme oželet jisté podrobnosti a třeba se smířit i s větší nepřesností. Pokud chceme mít naopak údaje velmi přesné či detailní, pak si musíme počkat, než jsou k dispozici. Samozřejmě s informačními technologiemi je dnes možné publikovat údaje nepoměrně rychleji a ve větším detailu, než dříve, ale stále je potřeba hledat kompromis mezi tím, jak rychle ukazatel potřebuji a jak přesný by měl být. Proto existuje více ukazatelů měřících jeden a tentýž jev, ale z různých pohledů.
Uveďme příklad. Řekněme, že nás zajímá, jak se daří ekonomice. Jaké máme možnosti? Nabízí se tzv. krátkodobé statistiky, například index průmyslové produkce, který je publikován zhruba 37 dnů po skončení měsíce (to je tak akorát na to, aby firmy udělaly měsíční závěrky a údaje rychle poslaly ČSÚ, který je zpracuje a odhadne index průmyslové produkce). Nebo se můžeme podívat na měsíční index stavební produkce či měsíční index tržeb v maloobchodně atd. Jak ale vidíme, jedná se vždy jen o jisté oblasti ekonomického života, určitá odvětví, nikoliv celou ekonomiku. Jedná se rovněž o údaje, které už jen z důvodu později dodaných detailních ročních strukturálních dat, mohou být upřesněny (když firmy ukončí roční závěrky, třeba až v červenci nebo září následujícího roku, pošlou ČSÚ podrobnější a přesnější údaje, než byly ty, které posílaly v rychlosti po měsíčních závěrkách). Je tedy evidentní, že pokud chceme údaje rychle, pak se musíme spokojit s méně přesnými (a často i méně detailními) údaji.
Vraťme se však k tomu, že hledáme údaj, který by co nejvíce vypovídal o ekonomice jako celku. V takovém případě nás napadne hrubý domácí produkt (HDP). Ten, pokud jde o kompromis mezi včasností, přesností a detailem, není žádnou výjimkou. První odhady čtvrtletního HDP jsou sice publikovány 30 dní po skončení čtvrtletí, ale jedná se pouze o tzv. bleskový odhad, čili předběžný odhad, který je sice velmi rychle dostupný, ale už z této jeho základní podstaty je nutné počítat s tím, že může být méně přesný a v budoucnu bude zpřesněn. Také se jedná pouze o jedno jediné číslo, bez jakýchkoliv detailů odhalujících hlavní faktory ekonomického vývoje. Měli bychom jej chápat spíš jako významný signál, kterým směrem se ekonomika vyvíjí, ale je třeba být opatrný při vyvozování silných závěrů postavených na tomto jediném údaji (odborník by mohl velmi laicky říct, desetina sem, desetina tam…).
Značně jiná je už situace o 30 dní později, kdy se zveřejňuje zpřesněný odhad HDP (tj. 60 dní po skončení čtvrtletí). V této chvíli je už k dispozici více podkladů od firem, domácností, státních institucí atd., takže odhad může být přesnější a zveřejněné údaje detailnější – uživatel se již například dozví, zda byl ekonomický růst tažen domácí poptávkou či zahraniční, nebo zda rostl průmysl nebo služby. A takováto zpřesnění jsou podle jasně dané revizní politiky plánována i pro další termíny publikace systému národních účtů, tj. statistického systému, jehož součástí je jako jeden z mnoha ukazatelů právě i hrubý domácí produkt. Je přirozené, že pozdější podkladové údaje jsou přesnější a detailnější, a proto dochází ke zpřesnění původně (rychle) publikovaných dat.
Pokud by nás zajímal až ten opravdu nejdetailnější a nejpřesnější obraz ekonomické situace, který může systém ročních národních účtů poskytnout, pak bychom si museli počkat nejméně 6 měsíců po skončení celého roku nebo spíše 1,5 roku či až 2,5 roku, kdy jsou vydány semi-definitivní, resp. definitivní verze ročních národních účtů za daný rok. Takové údaje už ale mají spíše analyticko-výzkumný charakter, nikoliv význam pro pochopení aktuálního (konjunkturálního) ekonomického vývoje.
Všechny výše uvedené ukazatele (a ještě mnoho dalších) lze považovat za kvalitní ukazatele vypovídající o ekonomické situaci, s jasně danou metodikou a obvykle i mezinárodní srovnatelností. Uživatel tak má možnost volby, co v dané situaci použije. Pokud preferuje rychlost, pak nemůže čekat 2,5 roku na velmi detailní a přesné údaje z ročních národních účtů a patrně sáhne po indexu průmyslové produkce nebo po předběžném odhadu HDP. Při interpretaci takových údajů však musí znát nejen jejich přednosti, ale i limity a omezení daná objektivními skutečnostmi a metodikou odhadu takových ukazatelů.
Foto: redakce EM
Zdroj: Darrell Huff
Osmá kapitola vychází už 12. 4. 2022
[1] FHA = Federal Housing Administration je vládní agentura v USA, zajišťující hypotéky na stavbu a koupi bydlení pro rodiny. Byla zřízena v roce 1934 zákonem o bydlení.


Sdílet
Hodnotit
1 Star2 Stars3 Stars4 Stars5 Stars

Doporučujeme

Jak lhát se statistikou: Jak statistikulovat (Kapitola 9 )

19.04.2022, Autor: Laura Feketeová

Dezinformování veřejnosti s využitím statistických materiálů se dá považovat za manipulaci; mohlo by se to také nazývat statistikulace (i když to slovo není moc pěkné). Podle názvu této knížky a některých příkladů, které jsou v ní uvedené, by se mohlo zdát, že cílem všech takových postupů je klamat.

Apogeo
e-news.cz - kurzy
e-news.cz - kurzy
e-news.cz - kurzy
e-news.cz - kurzy
Sazka reklama
Reklama

Jak lhát se statistikou: Napřed důsledek, potom příčina (Kapitola 8)

12.04.2022, Autor: Laura Feketeová

Jednou si někdo pořádně nadrobil, když zjišťoval, zda mají kuřáci ve škole horší známky než nekuřáci. Ukázalo se, že mají. To potěšilo spoustu lidí, kteří s tím potom pracovali, jak jen se dalo. Vzniknul dojem, že přestat s kouřením je cesta, jak dosáhnout lepších známek; a – když to domyslíme dál - že kouření otupuje mysl.

Jak lhát se statistikou - Exkluzivně na EM

31.03.2022, Autor: Laura Feketeová

Nejprodávanější kniha o statistice s exkluzivními poznámkami ČSÚ. Kniha, kterou již v češtině nikde neseženete. Výstižné komentáře doc.

e-news.cz - kurzy
Sazka reklama
e-news.cz - kurzy
e-news.cz - kurzy
e-news.cz - kurzy
Apogeo
Reklama

Jak lhát se statistikou: Obrázkové grafy (Kapitola 6)

29.03.2022, Autor: Laura Feketeová

Zhruba před deseti lety se hodně psalo o obyčejných lidech, čímž jsme byli míněni my všichni. Když to začalo znít příliš povýšenecky, stali se z nás tzv. běžní lidé. Brzo se ale vytratil i tento pojem a snad je to tak i dobře. Onen obyčejný člověk je ale pořád mezi námi. Je to postavička na grafech.

Jak lhát se statistikou: Graf, který má šmrnc (Kapitola 5)

22.03.2022, Autor: Laura Feketeová

Z čísel jde strach. Sebedůvěru Humptyho Dumptyho, který tvrdí Alence v říši divů, že je pánem slov, která užívá, by asi většina lidí na čísla nerozšířila. Možná máme trauma, které v nás zanechala aritmetika už na základní škole.

Sazka reklama
e-news.cz - kurzy
e-news.cz - kurzy
e-news.cz - kurzy
Apogeo
e-news.cz - kurzy
Reklama

Jak lhát se statistikou: Když chybí vysvětlivky (Kapitola 3)

08.03.2022, Autor: Laura Feketeová

„Uživatelé hlásí o 23 % méně zubního kazu při použití zubní pasty Doakes“, hlásá velký nápis. Mohli byste mít o 23 % méně bolesti, tak čtete dál. S uspokojením zjistíte, že tyto výsledky pocházejí z „nezávislé“ laboratoře a jsou potvrzené „certifikovaným“ znalcem. Co víc byste chtěli?

Jak lhát se statistikou: Co průměr zatajuje (Kapitola 2)

01.03.2022, Autor: Laura Feketeová

​Předpokládám, že nejste žádný snob a ujišťuji vás, že já nepodnikám v realitách. Na chvíli si ale představme, že jste snob a že já v realitách podnikám. Navíc si představíme, že hledáte nějakou nemovitost, kterou byste koupil a která aby nebyla daleko od kalifornského údolí, kde já bydlím.

e-news.cz - kurzy
e-news.cz - kurzy
e-news.cz - kurzy
Sazka reklama
e-news.cz - kurzy
Apogeo
Reklama