Představujeme rozhovor s Matějem Markem ze známého portálu statistickezpracovanidat.cz který se v rámci své profese věnuje vyhodnocováním dat výzkumů lékařů, psychologů, ale i studentů nejrůznějších oborů.
Zeptali jsme se ho na ožehavé zkreslování dat výzkumníky i na jeho zajímavé výzkumné oříšky.
Matěji, kolik výzkumů Vám prošlo excelem za celou dobu Vaši praxe?
Celkový počet svých projektů takto přesně zmapovaný nemám. Každopádně toto je vynikající příležitost na rekapitulaci.
Statistickému zpracování dat pro jednotlivce se věnuji něco přes 3 roky, v průměru dostanu každý týden minimálně jednu zakázku na statistickou analýzu, z toho drtivá většina je, jak píšete, v Excelu.
Tímto se dostávám k číslu 140 a víc. Když si vezmete, že taková analýza vám v průměru zabere 8 až 10 hodin, tak je to celkem hodně času stráveného nad Excelem.
Pracujete raději s čísly nebo s lidmi? A Proč?
To je velmi zajímavá otázka. Nad tím jsem ještě neuvažoval. Řekl bych, že spíše s čísly, protože jsou daleko jednoznačnější než jednotliví lidé.
Chci tím říct, že když se vám podaří nějakou informaci transformovat do číselné podoby, prostor pro subjektivní interpretaci klesá. Při práci s lidmi se často stane, že se na něčem domluvíte a ten dotyčný to myslel jinak apod. Také se říká, že čísla (nebo data) nelžou.
Za většinou čísel však stojí samotní lidé nebo jejich aktivita, proto se to úplně oddělit nedá. Lidský element k životu a práci neodmyslitelně patří. Neměli bychom zapomínat, že statistiku děláme proto, abychom lépe pochopili sebe a svět kolem nás.
Setkal jste se během Vaší praxe s nějakým zajímavým případem?
Svým způsobem je každý projekt zajímavý. Při této práci se člověk doví mnoho o oblastech a tématech, které by sám nevyhledával.
Tak například, pro mě je téma číslo jedna ekonomika a finance. Ve volném čase, kterého není nikdy nazbyt, by mě samotného nenapadlo číst například nějaký článek z oblasti sociologie.
Raději pracuji s čísli než s lidmi, protože jsou daleko jednoznačnější než jednotliví lidé. Také se říká, že čísla (nebo data) nelžou.
V rámci statistických analýz pro klienty si tak alespoň rozšířím znalosti z jiných oborů. Vybavuji si například studentku, která formou dotazníkového šetření získala informace o finanční situaci rodiny po narození dítěte.
Klientku zajímalo, jak závisí subjektivní hodnocení finanční situace na faktorech jako vzdělání, věk, dítě v pořadí apod. Překvapivým zjištěním pro mě bylo, že největší pokles životní úrovně nastal v případě rodin s vysokoškolským vzděláním.
Jakožto člověk s vysokou školou aspoň vím, na co se připravit, když budu plánovat založení rodiny.
Chtěl po Vás někdy někdo, abyste data zkreslil, aby mu to tzv. vyšly hypotézy?
Vysloveně s takovým případem jsem se nesetkal. Většina lidí v tomto ohledu přistupuje k své práci opravdu zodpovědně. Zajímá je, co jim jejich data říkají a co lze statistiky vyvodit z jejich dotazníků a výzkumů.
Na druhé straně, finální interpretace zůstává vždy na klientovi. Já se stále snažím dodat kromě samotných statistických výsledků i nějaký vlastní pohled na to, co lze a co ne za daných okolností z analýzy vyvodit.
Například se může stát, že statistický test sice ukazuje na významnost, ale já tam vidím nějaké limitace. V takovém případě na to určitě klienta upozorním. To, zda tohle omezení uvede klient i v práci, zůstává už jen na něm.
Všiml jsem si, že čím víc času a úsilí dotyčný do své práci sám vložil, tím bude i vyšší snaha z jeho strany upřímně své výsledky prezentovat.
Co si myslíte o farmakologických výzkumech, které jsou někdy zkreslené za účelem dokázání účinku látek?
Myslím, že v takových případech se jednoznačně jedná o podvod. Bohužel statistika má tu vlastnost, že na jedné straně její výstupy působí vědecky a sofistikovaně pro veřejnost, na druhé straně její vstupy (data, zvolené metody) poskytují velký prostor pro manipulaci.
Tento problém se zdaleka netýká jen farmaceutického průmyslu. V případě, že nějaká zájmová skupina prezentuje výzkumy, které ukazují přínosy jejich produktu nebo politického opatření, musíme být vždy na pozoru a ověřovat.
Co byste doporučil všem, kteří se chystají dělat nějaký výzkum a budou se zabývat zpracování dat?
Aby si dobře promysleli cíle práce před tím, než rozešlou svůj první dotazník, respektive začnou se sbíráním dat. Pořekadlo „dvakrát měř a jednou řež“ v tomto ohledu určitě platí.
Před stanovením cílů práce bychom si měli ověřit, zda naše cíle jsou realistické a zda disponujeme potřebnými daty. Praxe je mnohdy jiná. Výzkumník nejprve získá nějaká data a pak přemýšlí co s nimi vlastně dělat.
A na závěr mám ještě jeden tip pro budoucí výzkumníky – prezentujte svá data v grafech! Velké sumarizační tabulky musí čitatel složitě studovat, pokud se s nimi bude vůbec zabývat.
Žijeme v uspěchané době a lidé nemají čas hledat odpovědi v nepřehledných tabulkách a statistikách. Připravte proto hezké grafy, které poví příběh o vašem výzkumu. Čitatelé to určitě ocení nejen při hodnocení.
- Matěj vystudoval obor ekonometrie na Erasmus University Rotterdam.
- V rámci své profese věnuje statistickému zpracování dat výzkumů lékařů, psychologů, ale i studentů nejrůznějších oborů.
- Jeho zálibami jsou elektrická kytara.
Zajímavosti o vyhodnocování dat
- Data jsou často shromažďována z více zdrojů, proto je důležité zajistit, aby všechny zdroje byly spolehlivé a důvěryhodné. Toho lze dosáhnout ověřením přesnosti údajů a kontrolou jejich platnosti.
- Výzkumná data lze analyzovat mnoha různými způsoby, například pomocí deskriptivní statistiky, inferenční statistiky nebo prediktivní analýzy. Každý z těchto přístupů má své výhody a nevýhody, proto je důležité zvolit správný přístup pro konkrétní výzkumný projekt.
- Výzkumná data lze použít k vyvození závěrů o populaci, od které byla získána. Je však důležité mít na paměti, že data mohou poskytnout pouze omezený pohled na populaci a k vyvození přesných závěrů může být zapotřebí dalšího výzkumu.
- Je důležité mít na paměti, že výzkumná data mohou být ovlivněna vnějšími faktory, například prostředím, ve kterém byla shromážděna, nebo lidmi, kteří data shromažďovali. Proto je důležité analyzovat údaje v kontextu prostředí a lidí, kteří je shromažďovali.
- Výzkumná data lze použít k předpovědím budoucích událostí. Tomuto postupu se říká prediktivní analýza a lze jej využít při rozhodování o věcech, jako jsou investice nebo marketingové strategie.
Jak efektivně vyhodnocovat data
Výzkumná data jsou nezbytná pro přijímání informovaných rozhodnutí v jakémkoli oboru nebo odvětví. Efektivní vyhodnocení výzkumných dat však může být obtížné.
Proto je důležité mít jasnou představu o cílech výzkumu, zdrojích dat, metodách použitých ke sběru dat a technikách použitých k jejich analýze.
Za prvé je důležité mít jasnou představu o cílech výzkumu. To pomůže zajistit, aby data byla shromažďována a analyzována způsobem, který je relevantní pro cíle výzkumu.
Důležité je také porozumět zdrojům dat. Znalost zdroje dat může pomoci zajistit, aby byla data spolehlivá a platná. Jakmile je znám zdroj dat, je důležité porozumět metodám použitým ke sběru dat. To zahrnuje typ shromážděných údajů, velikost vzorku a další důležité informace.
Jakmile jsou údaje shromážděny, je důležité porozumět technikám použitým k analýze údajů. To zahrnuje typ použité statistické analýzy, typ tabulek nebo grafů použitých k zobrazení údajů a další důležité informace.
Důležité je také hledat v datech jakékoli trendy nebo vzorce. To může pomoci vyvodit závěry z výzkumných dat.
V neposlední řadě je důležité zvážit případné zkreslení nebo chyby ve výzkumných údajích. To zahrnuje hledání jakýchkoli odlehlých hodnot nebo datových bodů, které se výrazně liší od ostatních údajů.
Je také důležité zvážit možnost, že data byla nějakým způsobem zmanipulována.
Závěrem lze říci, že efektivní vyhodnocování výzkumných dat je důležitou dovedností pro každého, kdo se podílí na výzkumu nebo rozhodování.
Jasné pochopení cílů výzkumu, zdrojů dat, metod použitých ke sběru dat a technik použitých k analýze dat jsou důležitými kroky při efektivním vyhodnocování výzkumných dat.
Kromě toho je důležité vzít v úvahu případné zkreslení nebo chyby v datech, stejně jako případné trendy nebo vzorce.