Člověk nebo algoritmy? Čí články čtenáři upřednostňují?

25 května, 2016 • Nejnovější příspěvky, Nová média a Web 2.0, Top příspěvky • by

Před dvěma lety agentura Associated Press plně zautomatizovala výrobu zpráv a příjmech různých firem. Od té doby algoritmy, které jsou na základě strukturovaných dat schopny vyprodukovat plnohodnotné články, otřásly zpravodajským průmyslem. Takzvaná automatizovaná žurnalistika – často mylně označovaná jako robotická žurnalistika – je schopná vyprodukovat rutinní a opakující se příběhy. Potřebuje k tomu jediné – čistá, strukturovaná a spolehlivá data. Vedle finančního zpravodajství se může jednat o souhrny sportovních utkáních, zprávy o trestné činnosti a příběhy založené na senzorických datech, například o výskytu zemětřesení či úrovni polétavého prachu.

Dobře nastavené algoritmy dokáží na základě přesně definovaného zadání vytvořit doslova neomezené množství článků v různých jazycích, které jsou přizpůsobené konkrétním čtenářům. Navíc texty dokáží vyprodukovat rychleji než živí novináři, s omezeným množstvím chyb a za minimální náklady.

Algoritmy jsou trendy

Všechny tyto konkrétní ekonomické výhody přesně zapadají do logiky mediálních organizací. Ty se na jednu stranu snaží šetřit, na stranu druhou zvyšují produkci zpráv a chtějí nabízet personalizovaný obsah. Není potom příliš překvapující, že World Editors Forum vyhlásilo automatickou produkci zpráv za jeden z hlavních trendů v současné žurnalistice.

O nový fenomén se navíc začala zajímat už i populární média. Například Planet Money podcast nechalo zkušeného reportéra veřejnoprávního rozhlasu soupeřit s algoritmem. Deník New York Times zase vyzval své čtenáře, aby hádali, zda je prezentovaný článek dílem novináře z masa a kostí nebo počítačového algoritmu.

Zkoumání percepce automatizovaných zpráv

V našem výzkumu s názvem Readers Perception of Computer-Generated News jsme zkoumali vnímání počítačově vytvořeného obsahu ze strany publika. Výzkum vznikl ve spolupráci s Bastianem Haarmannem and Hans-Berndem Brosiusem. Zajímalo nás, jak čtenáři posuzují kvalitu automatizovaného obsahu v porovnání se zprávami, u nichž je jako autor uvedený člověk.

Všech 986 účastníků dostalo k přečtení dva texty, jednalo se o zprávy z oblasti byznysu a o shrnutí fotbalového zápasu. Texty napsané lidmi byly převzaty z populárního německého zpravodajského serveru. Počítačem vygenerovaný obsah se stejnými tématy nám poskytl Fraunhofer Institute for Communication, Information Processing and Ergonomics. Institut se zabývá právě tvorbou optimálního algoritmu pro psaní zpráv. Ve všech případech jsem účastníky upozornili, které články byly vytvořené lidmi a které počítačem. V některých případech jsem ale záměrně zatajili autora textu, nebo jsme účastníků podali nepravdivé informace.

Algoritmy prezentované jako autoři z masa a kostí

Účastníci obecně preferovali obsah vytvořený živoucími novináři a to i v případech, kdy se ve skutečnosti jednalo o počítačem vytvořený obsah. Jinými slovy, pouhá informace, že se jedná o článek napsaný konkrétním člověkem, měla pozitivní efekt na jejich hodnocení. Čtenáři počítačem vytvořené texty více zkoumali a hledali prvky, které by algoritmus usvědčily. Překvapující může být to, že účastníci přisuzovali vyšší důvěryhodnost počítačově vytvořeným textům. Důvodem tohoto zjištění může být například to, že texty vytvořené algoritmem jsou plné složitých čísel, což může zprávu činit důvěryhodnější.

Rozdíly ve vnímání obou přístupů byly obecně poměrně malé, což potvrzují i ostatní podobné studie provedené v Dánsku a Nizozemí. Z toho můžeme usuzovat, že automaticky vytvořené texty mohou co do kvality směle soupeřit s texty autorskými, tedy alespoň v případě rutinních zpráv.

Toto zjištění navíc umocňuje skutečnost, že mnoho autorských článků je přijímáno jako texty, které byly vytvořené počítačem. Většina z nich má totiž podobnou strukturu a typický zpravodajský jazyk, přeříkávají tvrdá data bez sofistikovanější narace. Právě toto je přitom důvod, proč může něco takového jako algoritmická žurnalistika existovat, a proč čtenáři nejsou schopni rozpoznat rozdíly. Explicitněji řečeno, sami novináři, kteří tvoří rutinní zpravodajství, umožňují, aby byli snadno nahrazováni počítači.

Některé pracovní pozice zaniknout, jiné naopak vzniknout

Není příliš překvapující, že mnoho novinářů vnímá algoritmy jako hrozbu a způsob pokrytí tohoto tématu je často zatížen důrazem na souboj člověk vs. stroj. Zde je třeba zdůraznit, že nejspíš zaniknout některé pracovní pozice, jiné ale naopak právě díky automatizaci vzniknou. Například automaticky vytvořené texty vyžadují svědomitou editorskou kontrolu a samotné algoritmy je třeba aktualizovat a udržovat.

Autorský a automatizovaný obsah se tak začne více propojovat a vznikne tak rovnocenný vztah, v němž oba – novináři a počítače – budou dělat to, co umí nejlépe. Algoritmus bude schopný najít zajímavý příběh, analyzovat data a poskytne první verzi článku. Novinář by tento holý text následně mohl obohatit o podrobnější analýzu, provést rozhovory a doplnit článek o kontextové a zákulisní informace.

Algoritmy na poli „hard news“

Nedávno jsme se pustili do nového projektu, jehož cílem je na základě prognóz letošních prezidentských voleb v USA vyvinout algoritmus pro tvorbu automatizovaných zprávy. Spoléháme se přitom na údaje z internetových stránek PollyVote.com, které poskytují předvolební prognózy. Stránka byla založena v roce 2004 a jejím cílem je ukázat výhody předvolebních prognóz, které jsou založené na konkrétních a jasných datech.

Na základě informací z tohoto serveru vytvoříme první návrh článku, který by již zahrnoval důležitá fakta a základní analýzu. Například v případě hlasování a sčítání hlasů by článek nejprve popsal, kdo a kdy hlasoval. Zdůraznil by velikost vzorku, možnou statistickou chybu a samozřejmě by také uvedl výsledky hlasování. Zároveň by ale naším algoritmem vygenerovaný text porovnával aktuální hlasování s průměrnými výsledky. Automatizovaný článek by tak neposkytl pouhé shrnutí známých faktů.  Hlasování by také uvedl do kontextu a porovnal výsledky s předvolebními prognózami.

Tím, že se zaměříme na politické zpravodajství a prognózy, navíc posuneme automatizovaný obsah do oblasti „hard news“. Algoritmy již nebudou záležitostí rutinního zpravodajství. Tento text nám naopak umožní studovat, jakým způsobem čtenáři s různým stupněm zainteresovanosti vnímají počítačové texty týkající se takto citlivých témat.

 

Andreas Graefe, Mario Haim, Bastian Haarmann and Hans-Bernd Brosius: Readers’ perception of computer-generated news: Credibility, expertise, and readability. Journalism, Published online before print April, 2016

Picture credit: Wikimedia Commons

Tags:, , ,

Komentáře jsou uzavřené.

Send this to a friend