Nahradí novináře roboti, nebo budou pouze jejich nezbytnými pomocníky? Jak jim mohou pomoci? Co všechno lze v novinářské praxi automatizovat a jaké postupy využívá Česká tisková kancelář (ČTK) už nyní? A jaké nevýhody zapojení algoritmů do žurnalistiky přináší? To se řešilo na listopadových Rozpravách o českých médiích na půdě Institutu komunikačních studií a žurnalistiky Fakulty sociálních věd UK.
Diskutovat přišli šéfredaktorka zpravodajství ČTK Radka Matesová Marková, technický ředitel ČTK Jan Kodera, šéfredaktor Fotobanky ČTK Petr Mlch a Václav Moravec, moderátor České televize a pedagog na Katedře žurnalistiky IKSŽ FSV UK. Rozpravy moderovala děkanka FSV UK Alice Němcová Tejkalová.
Automatizovaná či robotická žurnalistika
S ohledem na vývoj světové žurnalistiky se začíná umělá inteligence v novinařině uplatňovat ve stále větší míře. Samotný termín umělá inteligence je ovšem potřeba nenadužívat a spíše hovořit o automatizované či robotické žurnalistice a na to navazující žurnalistice umělé inteligence, jak upozornil Václav Moravec. Co to vůbec znamená? „Automatizovaná či robotická žurnalistika znamená, že existují nějaké šablony, které automaticky, bez lidské ruky generují texty,“ vysvětlil Moravec.
Zmínil příklad Spojených států, kde se robotická žurnalistika prvotně uchytila v roce 2010 s nástupem start-upových firem, jako je Narrative Science anebo sportovní síť Big Ten Network, která začala zveřejňovat stručné sportovní zprávy z klání univerzitních týmů. Návštěvnost stránek se díky tomu zvýšila zhruba o třetinu, protože provozovatelé stránky byli schopni nabízet zpravodajství rychleji než všichni ostatní.
V českém prostředí jako první médium nasadila automatizovanou žurnalistiku v redakční praxi ČTK při letošních volbách do obecních zastupitelstev a do třetiny Senátu, o čemž bude řeč níže. „Tím jsme zahájili etapu, která si dovolím tvrdit, že se bude jmenovat etapou žurnalistiky robotické či automatizované a umělé inteligence, která nás vlastně odsune z té současné etapy, kterou v tom konceptu členění žurnalistiky nazýváme internetovou žurnalistikou, byť se samozřejmě ty etapy budou prolínat,“ uvedl Moravec.
Co dělá v oblasti automatizace žurnalistiky ČTK
Jan Kodera zmínil, že pojem „robotická žurnalistika“ je z jeho pohledu problematický, neboť roboti novináře nenahradili a stále se jedná „pouze“ o nástroje, které toho samy o sobě zas tolik neudělají – vždy je zapotřebí lidský zásah. Automatizace je pak využívána především při sběru informací (např. textových, obrazových nebo datových) třeba za využití dronu, ověřování (např. autenticity fotografií), automatizované tvorbě textů, vizualizací nebo grafiky a cílené distribuci informací.
Při samotné tvorbě textů jsou využívány více či méně složité algoritmy, které zpracovávají data, respektive strukturované informace, které lze odněkud získat. Automatizace slouží také k tvorbě abstraktů nebo různých shrnutí a odvození od jiných textů a výtahů z delších nijak nestrukturovaných textů. Technologicky jsou těmito algoritmy zejména ručně připravované šablony.
„Pokročilejším nástrojem, který se využívá poměrně krátkou dobu, jsou algoritmy z oblasti umělé inteligence – algoritmy strojového učení, kde už je ta situace podstatně zajímavější a taky náročnější na pochopení (…) Ten algoritmus se učí sám od sebe, respektive od svých výsledků a od toho, jak to někdo oklasifikuje,“ popsal Kodera. Strojové učení se přitom uplatňuje i v gramatice a stylistice, výběru a způsobu prezentace dat nebo při porozumění textům.
Konkrétní využití a volební zpravodajství
Jak konkrétně se tedy umělá inteligence v agenturách využívá? „Pro agentury je specifické to, že my vytváříme takové to základní zpravodajství, nepouštíme se příliš do nějaké investigativy, komentářů a podobných záležitostí. Z toho také vyplývá, že pro nás je zajímavější ta přímá tvorba textů a méně důležité pro nás jsou ty nástroje okolo, které slouží třeba k tomu ověřování informací, byť to samozřejmě taky děláme a využíváme, ale není to v takové míře, v jaké to může být jinde v médiích,“ vysvětlil Kodera s tím, že poprvé byla umělá inteligence v tiskové agentuře využitá v roce 2014 v Americe.
V ČTK první počítačový redakční systém nasadili už v roce 1992 a dnes hojně využívají šablony pro generování automaticky tvořených zpráv, například plány, deníky událostí či redakční souhrny. V roce 2006 ČTK spustila multimediální redakční systém, v němž jsou poprvé použity vazby mezi jednotlivými typy médií. Volební zpravodajství pak využilo možností automatizace v zatím největší možné míře. Důležité podle Kodery bylo, že novináři se nemuseli věnovat přepisování čísel, která publikoval Český statistický úřad (ČSÚ), ale mohli například sbírat reakce lidí na výsledky voleb.
Radka Matesová Marková uvedla, že texty z dílny robotů během volebního zpravodajství byly označeny jako „RUR“ s odkazem na dílo Karla Čapka, aby odběratelé agentury rozpoznali, že se jedná o robotickou žurnalistiku. „To, co jsme zatím použili, to je skutečně automat. Jsou to připravené šablony, není to žádný zásah umělé inteligence a v zásadě práci, kterou bychom byli bývali dělali stejně, tak jsme ji udělali jiným způsobem,“ řekla Matesová Marková. „Pro nás byl jeden z hlavních poznatků ten, že budeme příště muset trošku změnit nasazení editorů, protože stroj nečeká – když data má, tak je prostě vyplivne a chrlí je neskutečně rychle,“ doplnila.
ČTK podle ní nyní zvažuje, v jakých jiných případech lze automatizaci využít; v úvahu přichází například sportovní události a výsledky – třeba i z olympijských her. Záleží ale samozřejmě i na ochotě institucí poskytovat data. Podle Kodery třeba ČSÚ dodává data ve formátech, které jsou vhodné pro strojové zpracování, se statistiky se lze jednoduše dohodnout a snaží se vyhovět. Jsou ale i negativní případy, kdy se to některé úřady snaží odbýt nebo udělat co nejjednodušší cestou, takže data poskytují třeba jen ve formátu PDF. Jiné instituce zase nejsou ochotné data poskytovat prakticky vůbec, například Fotbalová asociace ČR (FAČR).
A jak je to s praktickým využíváním automatizace v jiných situacích, třeba při verifikování autenticity fotografií? „Systém, který by automaticky zajišťoval nějakou kontrolu, nemáme. Máme kromě vlastní produkce celou řadu dalších partnerů, kteří smluvně garantují, že ty fotografie budou v pořádku a k těm selháním nebo „fejkům“ dochází výjimečně,“ uvedl Petr Mlch.
„Pro nás je z tohoto hlediska zajímavější fúze mezi textem, ať už generovaným automaticky, nebo ne, a automatickým dohledáváním snímků. Editor třeba potřebuje dohledat nějaké ilustrační fotografie a pro nás by v budoucnu bylo zajímavé mít nějakou utilitu, která by to dělala automaticky,“ podotkl Mlch.
Velkým úskalím jsou podle něj klíčová slova a také složitost českého jazyka. S tím souhlasí i Kodera: „I kvůli komplikovanosti českého jazyka ještě nějakou dobu potrvá, než budou k dispozici nástroje, které dokážou významně pomoci i v oblasti rešerší nebo zpracování strukturovaných textů,“ uvedl s tím, že zatím je ČTK schopná pracovat opravdu jen v oblastech, kde jsou k dispozici data.
Pohled do budoucna
Do budoucna lze nicméně pochopitelně očekávat další vývoj ve využívání automatizace a umělé inteligence v žurnalistice. Už teď se například můžeme setkat s tím, že roboti moderují zpravodajské relace v čínských televizích. Výhledově se tak uplatnění v publicistice rozhodně nedá vyloučit. Inovativní prvky jsou však v české žurnalistice včetně ČTK nebo České televize limitovány prostředky, které jsou k dispozici.
„Myslím si, že se to v následujících letech bude uplatňovat spíše ve zpravodajství, kde to budeme i my testovat (Česká televize – pozn. aut.). Jako výzkumníci budeme zkoumat to, jestli se proměňuje pracovní trh, bude to klást asi nové zásadní nároky na editory. Bude to klást i tu etickou otázku: máme to těm uživatelům říkat? Má čtenář vědět, že to psal nějaký automatizovaný algoritmus, že to souvisí se zásahem algoritmu?“ uvedl Moravec.
Stěžejní je také sdílení poznatků napříč agenturami. V říjnu ČTK hostila celosvětovou konferenci sdružení MINDS, kde se řešila právě robotická žurnalistika, ale třeba i moduly pro plánování zpravodajství a další inovace vedoucí k posílení vazby na média. MINDS tak slouží pro ke spolupráci nejen v oblasti vývoje a technických řešení, ale i v oblasti obchodu, nebo marketingu.
Věčný spor: robot versus člověk
Problémy spojené s automatizací zahrnují především dostupnost (a nedostupnost) dat, náklady na zavedení těchto postupů, komplexnost a neurčitost algoritmů (nevidíme přímou souvislost, proč se stroj takto zachoval), ale taky jde o nedůvěru a „konkurenci“ stroje a člověka a také o etické aspekty.
Palčivá je i problematika důvěryhodnosti, či nedůvěryhodnosti zpravodajství, které vytváří roboti. Zatím totiž to, že je něco produktem robotů, přináší apriorně jakousi nedůvěru. Podle Matesové Markové je proto potřeba přesně vysvětlit, jakým způsobem zpravodajství tohoto druhu vzniká a jakým způsobem se s tím pracuje. „Já osobně si myslím, že bude potřeba dělat hodně velkou osvětu mezi novináři, kteří s těmi texty budou pracovat,“ podotkla Matesová Marková. Podle Moravce to pak logicky přinese i změnu novinářského vzdělávání.
V současnosti stále ještě všechno prochází přes editora. „Zatím nejsme ve stavu, že bychom v tuto chvíli uvažovali o tom, že něco půjde ven automaticky bez zásahu, myslím tím ve zpravodajství,“ uvedla Matesová Marková s tím, že automaticky ČTK zatím už řadu let publikuje třeba deníky očekávaných událostí. A Kodera dodal: „Ve chvíli, kdy ten stroj vytváří tu materii, tu podstatu zpravodajství, tak se na to lze spolehnout, a naopak se uvolňují ruce pro to, aby se zpravodajství doplnilo o oblasti, kde je vhled lidského rozumu do problematiky nezbytný.“
Stále existuje velká škála témat, u kterých je naprosto nepředstavitelné, že by je mohl zpracovávat ryze, nebo byť jen zčásti automat. „Ve zpravodajství je spousta situací, kde nasazení možné nebude, a věřím tomu, že roboti nenahradí profese, které jsou tvůrčí, což žurnalistika je, a doufám, že ještě pořád bude,“ řekla k tomu Matesová Marková. Důležitá je podle ní také práce s backgroundy, přičemž souvislosti je do článků nutné uvádět průběžně. I to je limitem robotů.
V současnosti se redefinuje rovněž pohled na soukromí. Veřejná data jsou podle Moravce sice obrovskou příležitostí, ale jejich zpracovávání přináší sporné etické aspekty. Moravec proto s týmem akademiků zahájil tříletý výzkumný projekt s názvem „Proměna etických aspektů s nástupem žurnalistiky umělé inteligence“ týkající se etických výzev a etických dopadů, které s sebou tato „etapa žurnalistiky robotické či automatizované a umělé inteligence“ přináší.
Foto kredit: Adam Hecl (IKSŽ FSV UK); článková fotografie: Alexabrunet.com
Tags:agentura, agenturní zpravodajství, automatizace, Česká tisková kancelář, ČTK, datová žurnalistika, robotická žurnalistika, rozpravy, Rozpravy o českých médiích