Big data neboli velké objemy dat a jejich zpracování a analýza přinesly revoluci do toho, jak nakupujeme, pracujeme a komunikujeme. Jejich využití nyní nabírá spád také ve vědeckém výzkumu. Profesor Malcolm Parks z Washingtonské univerzity připravil speciální vydání časopisu Journal of Communication, aby ukázal potenciál analýzy velkých dat ve výzkumu masové komunikace. Jeho cílem bylo představit současné špičkové empirické studie a nabídnout tak měřítko pro inovaci výzkumu.
Parks tvrdí, že jsme ve výzkumu masové komunikace prostřednictvím analýzy velkých dat teprve na začátku. Také připomíná, že samotné zpracovávání obrovského množství čísel automaticky nepřináší zajímavé výsledky. Velká data se zkrátka neobejdou bez pořádného výzkumného návrhu a testování hypotéz.
Big data v odborném diskurzu
Příspěvky do zvláštního čísla časopisu pokrývají širokou škálu výzkumných zájmů, ačkoli sedm z osmi studií se zaměřilo na data z Twitteru. Eleanor Colleoni se svými kolegy zjišťovala, zda se uživatelé Twitteru, kteří jsou podobného politického přesvědčení, shlukují do skupinek, nebo zda komunikují napříč politickým spektrem. Sherry Emery a její kolegové zkoumali reakce uživatelů Twitteru na kontroverzní kampaň o veřejném zdraví. Fabio Giglietto a Donatella Selva analyzovali kompletní databázi tweetů za celé jedno období televizních talk show, aby zjistili, jak publikum interaguje s televizním programem.
Tři studie se zaměřily na nastolování agendy (agenda setting), z toho dvě s ohledem na politické kampaně. Andreas Jungherr analyzoval tweety během volební kampaně v Německu v roce 2009 a Chris Vargo s kolegy zkoumali zprávy z Twitteru během prezidentské kampaně v USA v roce 2012. W. Russel Neuman s kolektivem se také zabývali vzorci rámcování témat (issue framing) v sociálních a tradičních médiích v tomto kontextu (v roce 2012 v USA), ale neomezovali se přitom pouze na volební kampaně.
Benjamin Hill a Aaron Shaw zvolili odlišný přístup k velkým datům a zkoumali organizační strukturu přispěvatelů do Wikipedie.
Malcolm Parks, který se specializuje na sociální sítě a mezilidskou komunikaci, poskytl EJO rozhovor o výzvách ve výzkumu velkých dat. Parks se domnívá, že velká data vedou k „novým výzkumným otázkám a novým způsobům přemýšlení o již existujících otázkách“ a umožňují badatelům spojovat různé soubory dat – z různé doby, různého místa nebo nasbírané v různém čase. Zároveň však varoval, že je příliš brzy na to hodnotit, zda velká data přinesou změnu v tom, jakým způsobem zkoumáme komunikaci.
Co považujete za nejdůležitější přínos výzkumu velkých dat v oblasti komunikačních studií?
Malcolm Parks: Nyní je to tak, že velká data na nějaký svůj skutečně zásadní přínos pro obor komunikace teprve čekají. Je příliš brzy na to očekávat nějaké zásadní příspěvky. Jsme stále v průzkumné fázi. Dnes převažují ukázkové projekty a deskriptivní analýzy. Jen málo z již uskutečněných studií bude mít déle trvající efekt, ale spousta z nich zcela jistě přispěje k právě probíhajícímu procesu rozvoje koncepce a metodologie. Jakmile budou tyto metody dostupnější i vědcům, kteří se již teď zabývají podstatnými otázkami, jsem si jist, že se dočkáme velkého přínosu velkých dat.
Co jsou podle vás nejnáročnější omezení ve výzkumu velkých dat?
Parks: Podle mého názoru se dvě největší výzvy týkají platnosti výsledků a přístupu. Co se týče oné validity, v současnosti často najdeme rozdíly mezi interpretací indikátorů u velkých dat a skutečností, kterou tyto indikátory zobrazují. Otázka přístupu k datům také zůstává otevřená. Často nejsme schopni získat přístup k užitečným datům, protože jsou uzamčena za soukromými nebo vládními firewally. Ve výsledku je tu pak riziko, že přeinterpretováváme ta data, která máme k dispozici.
Jak a kam dál? Co je další metou ve výzkumu velkých dat?
Parks: Lze říct, že jsme se s naším způsobem uvažování o velkých datech ocitli na jakési hranici. Metaforicky řečeno, bylo by načase přesunout metody výzkumu velkých dat z periferie do centra, kde mohou být využity k řešení větších intelektuálních úkolů v rámci disciplíny. Velká data neznamenají konec teorie nebo konec vědy, jak mnozí tvrdili. Jejich potenciál pro rozvoj metodologie je obrovský, ale využit bude pouze tehdy, umožní-li nám následně vyřešit teoretické otázky. Příležitostí přibývá, jak se tyto metody rozrůzňují a více a více z našich sociálních aktivit a médií zůstává zachováno v datových uložištích. Ale s tím také přibývá spousta etických a politických otázek, jež se týkají přístupů k našim čím dál více „zdatovaným“ já.
Foto: Flikr Infocux Přeloženo z článku Exploring Big Data: New Research from the US publikovaném na anglické verzi EJO.