Jak pracují čeští datoví novináři? „Rychle a jednoduše, to neumíme.“

17 prosince, 2019 • Aktuality, Nejnovější příspěvky • by

Napsat zprávu co nejrychleji a co nejjednoznačněji, tak zní zákon žurnalistiky. Jenže pak jsou tu datoví novináři, kteří se noří do obřího množství komplikovaných dat.

„Jakýkoli náš projekt může skončit titulkem: Je to složitější,“ popisuje největší potíž datové žurnalistiky Petr Kočí, člen datového týmu Českého rozhlasu. Spolu s kolegou Janem Cibulkou vysvětluje, jak je obtížné skloubit často zdlouhavou a nejistou práci s daty s běžným chodem redakce nebo jak z hromady informací vytěžit jasný titulek. A kde vlastně v Česku vzít zajímavá data?

Na první pohled pracují datoví novináři v Českém rozhlasu podobně jako běžný novinářský tým. Členové mají rozdělená témata, o která se dlouhodobě zajímají, a opírají se o síť zdrojů od expertů až po neziskové organizace. Kromě toho ale ještě spolupracují s ostatními odděleními rozhlasu a připravují data pro jejich reportáže.

„Například Český rozhlas Plus má každý měsíc veřejné debaty na aktuální témata, takže tři týdny před debatou vymýšlíme nějaká data,“ popisuje redakční provoz Kočí. Naposledy šlo o budoucnost trhu práce a přicházející automatizací. K debatě vznikl grafický přehled, s jakou pravděpodobností kterou práci nahradí roboti. „Například skladníka stroje dokážou zastoupit v 81 % kompetencí, instalatéra v 60 %.“

Co se zatím moc datovým novinářům v Českém rozhlasu nedaří, je podílet se na každodenním chodu jednotlivých stanic a vypomáhat s denní agendou. „Někdy se objeví téma, ke kterému nejsou obecně známá tvrdá data. a my jsme schopni je rychle vytáhnout. Ale stává se vlastně docela vzácně, že nás editoři stanic osloví, rádi bychom to dělali víc,“ popisuje Kočí. A za příklad dává několik let starou kauzu, kdy někdejší premiér Petr Nečas kritizoval „dalajlamismus“ a „pussyriotismus“ a argumentoval tím, že taková vyjádření poškozují český export do Číny a Ruska.

„Ukázalo se, že ten export je tak malý, že vlastně nemá žádný význam. A tahle data, která jsme za půl hodiny vytáhli z Českého statistického úřadu, posunula debatu dál,“ dodává Kočí. Zároveň ale přiznává, že podobná „rychlá data“ už si běžní novináři umí čím dál častěji opatřit sami, a proto se vyplatí cílit na dlouhodobější projekty.

Čím lepší data, tím míň důvěry

Kromě toho, že práce datových žurnalistů často nekoresponduje s běžných chodem redakcí Českého rozhlasu, má i další potíž. Výsledky se často dostávají do rozporu se zpravodajskými hodnotami, jako je rychlost, srozumitelnost nebo jednoznačnost. „Když se do těch dat ponoříte, velmi často zjistíte, že se to nedá říct tak jednoduše a tak rychle,“ směje se Kočí.

Jako příklad udává nedávný text o tom, že v Česku šestinásobně vzrostla spotřeba antidepresiv – informace, kterou dataři vytěžili z ročenek Státního ústavu pro kontrolu léčiv. „Pro laika je to alarmující číslo a v běžném redakčním rytmu by se z toho udělal skandální titulek s půlkou věty nějakého psychiatra,“ popisuje Kočí. Když ale redakce data několik týdnů konzultovala s psychiatrem, dostala jiný obrázek.

„Vlastně se nic neděje. Spotřeba sice roste, ale proto, že je tu nová generace psychofarmak, která se předepisuje i na jiné problémy, změnila se diagnostika a tak dál,“ dodává Kočí. Podobné je to s projektem o kriminalitě v různých částech Česka. „Čím lepší data jsem měl, tím míň jsem jim věřil. Ta statistika nakonec vypovídá spíš o tom, jak kde policie intenzivně pracuje,“ popisuje Cibulka.

Což je ovšem výsledek, který nechce žádný šéf zpravodajství od svého novináře slyšet. „Tady se tyto zpravodajské hodnoty ctí a prosazují se. My se v debatě s mediálními manažery učíme, kde a proč jsou někdy užitečné, a oni se od nás učí, proč je lepší někdy něco nevydat nebo s tím počkat,” vysvětluje Kočí.

Každodenní ježdění

Datová žurnalistika je často zdlouhavá práce s nejistým výsledkem. Možná proto se v Česku „datařina“ ve velkých mediálních domech programově nepěstuje. „V současných ekonomických modelech českých médií se to nezaplatí. Je jednodušší mít stážistu, který klopí méně čtené texty, ale naklopí jich hodně a v součtu udělá kliky,“ myslí si Cibulka.

Tým, který nyní pracuje pro Český rozhlas, začínal před lety v Hospodářských novinách, odkud ale nakonec odešli. „V médiu veřejné služby je pro naši práci prostor větší než v komerčních médiích, kde jsme před čtyřmi lety na tenhle problém narazili,“ popisuje Kočí a dodává: „Můžu citovat jednoho z našich tehdejších nadřízených, když jsme odcházeli: že jsme takový nablýskaný kabriolet, na který se dají balit holky o víkendu, ale na to každodenní ježdění to moc není.“

Hospodářské noviny poté samostatný datový tým neobnovily a těží z práce několika milovníků statistiky a tabulek. Datového žurnalistu má například Deník vydavatelství Vltava-Labe-Media. Zbytek lidí, kteří v Česku analyzují větší objemy dat, nepracují pro média, ale například pro statistické agentury nebo na vlastních projektech jako například Michal Blaha.

Největší porci dat tvoří ta, která se dají volně dohledat na internetu. „Hrubý odhad je, že osmdesát procent jsou data, která se dají najít na webu. To ale ještě neznamená, že jsou dobře přístupná a člověk nepotřebuje nějaké technické znalosti, aby se k nim dostal,“ popisuje Kočí.

Například i výsledky voleb, které Český statistický úřad zveřejňuje v maximálně vstřícné formě, jsou pro běžného novináře obtížně zpracovatelné – jedná se o velké soubory dat roztříštěných na jednotlivé volební okrsky, jejichž strukturu musí novinář podrobně nastudovat, aby z nich dokázal vytěžit konkrétní zjištění. Třeba unikátní mapu výsledků v jednotlivých volebních okrscích vyvíjel datový tým rozhlasu čtrnáct dní.

Z volebních dat ale vznikají i rychlé analýzy – například přehled měst, ve kterých zvítězila některá strana tak drtivě, že může vládnout sama. Nebo čtenářsky populární žebříčky, komu nejvíce pomohly či uškodily preferenční hlasy.

„Chce to už trošku víc vědět, jak data vyfiltrovat. Dříve se čekalo třeba na politology, až to zanalyzují, což trvalo nějaký čas. My jsme to do značné míry zautomatizovali, takže jsme poměrně rychlí,“ dodává Kočí.

Jak bolí svobodné informace?

Další cestou, kterou ale datový tým používá spíše výjimečně, je sesbírat si data sám. Když například miliardář Karel Janeček navrhoval zavedení volebního systému 2.1 na principu plusových a mínusových bodů, datový novináři ho zkusili porovnat s více volebními systémy. „Kolega namodeloval více systémů a nechal v nich čtenáře odvolit – na datech pak ukazoval, jak se jednotlivé systémy chovají. Lidí, kteří se do toho zapojili, bylo kolem dvou tisíc.

Dalším příkladem jsou sportovní data – tým začal před lety s projektem „Jak bolí maraton“.  Na amatérského běžce redaktoři navěsili senzory a spolu s lékařem vyhodnocovali v průběhu maratonu jeho zdravotní údaje. “Doktor díky těm údajům zabránil, aby zkolabovat,” směje se Cibulka.

Nápad teď recyklovali s nejslavnějším českým horolezcem Adamem Ondrou. „Ve spolupráci s brněnskou sportovní fakultou jsme vymodelovali, jak leze, co to dělá s jeho tělem, i v porovnání s jinými lezci,“ popisuje Cibulka.

Posledním způsobem, jak získat data, je vyžádat si je od státní správy přes zákon o svobodném přístupu k informacím. I přes povinnost úřadů informace poskytovat musí datový tým vést řadu soudních sporů.

Výmluvy úřadů jsou přitom často kuriózní – pražský organizátor dopravy Ropid například nechtěl poskytnout data o přepravních průzkumech, protože by prý taxikáři na vytížených linkách začali konkurovat pražskému dopravnímu podniku. Policie zase podle slov datového týmu vyčíslila, že za poskytnutí dat o kriminalitě má Český rozhlas zaplatit 25 milionů korun.

„Žalob bylo zatím dohromady dvanáct. Těch případů by bylo víc, ale nemá cenu žalovat nic, co nebude použitelné za dva za tři roky, až soud rozhodne,” popisuje praxi Cibulka: „Úřady vědí, že než to soud vyřeší, bude daná věc pasé, nebo už novinář v daném médiu nebude pracovat.”

Podle Kočího se přesto situace s poskytováním dat na základě žádostí postupně zlepšuje – když před několika lety začínali s mapou odtahů v Praze, městská policie nechtěla informace vůbec vydat. Dnes už tato data poskytují bez „větších výmluv“.

Otevřete data

Co se zatím v Česku daří jen pomalu, je zveřejňovat “otevřená data” – tedy informace snadno dohledatelné a v dobře zpracovatelném formátu. V Česku například existuje Národní katalog otevřených dat pod ministerstvem vnitra, ve kterém je v tuto chvíli ze všech státních úřadů, firem a radnic registrováno jen 25 poskytovalů a ne všichni z nich mají data v požadované kvalitě.

Od ledna 2017 platí nařízení vlády, které úřadům ukládá zveřejňovat informace ze čtyřiadvaceti registrů – například jízdní řády, údaje o zaměstnanosti, seznamy poskytovatelů zdravotních služeb a další. V roce 2018 k nim přibylo dalších 13 datových sad – například seznamy směnáren nebo registrovaných léčiv. Jak ale přiznávají zástupci státní správy, některé úřady přesto data nezveřejňují.

„Velká část otevírání dat je jen na oko. Tak třeba nový registr firem – někdo si odškrtl položku otevřená data, jenže v tom systému chybí data narození vlastníků či jednatelů. Takže není vůbec možné rozkrývat vazby mezi firmami,“ popisuje reálné zkušenosti s otevíráním státních dat Cibulka.

Podle mezinárodní nadace Open data Barometer, která měří stupeň otevřenosti dat v zemích po celém světě, se situace u nás v minulých letech dokonce spíše zhoršila – zatímco v roce 2014 ČR dosáhla na skóre 58, poslední data z roku 2016 ukazujují zhoršení na skóre 44.

Box:
Tým datové žurnalistiky tvoří čtyři lidé Petr Kočí, Jan Cibulka, Jan Boček a Michal Zlatkovský. První tři jmenovaní začínali v Hospodářských novinách, pro které získali Novinářskou cenu nebo Křišťálovou lupu. Jejich vzdělání zahrnuje novinařinu, IT, ale třeba i politologii. Pro Český rozhlas pracují čtyři roky, a to externě přes firmu Samizdat. Letos v říjnu Český rozhlas se Samizdatem uzavřel smlouvu na 6 milionů korun na další dva roky.

Tags:, ,

Komentáře jsou uzavřené.

Send this to a friend