Uvedení do problematiky semináře (první t řetina semestru)
Přístup k datům
Způsoby stahování
Veřejně dostupná data v českém prostředí - příklady
Zpracovávání dat, dostupné nástroje a interpretace
Nejčastější chyby v interpretaci u žurnalistů, špatné příklady z médií
Praktický workshop na příkladu datových zdrojů Socialbakers* (dvě třetiny semestru)
Jak visualizovat data (a jak ne).
Co můžeme říct o lidech, kteří sledují (mentionují) profil na Twitteru? Příklad na politice a médiích.
Identifikace klíčových lidí v síti.
* Datové zdroje se sestávají z veřejně měřitelného obsahu sociálních sítí prostřednictvím developerského rozhraní (APIs). Primárně se v datech určených pro mediální komunikaci společnost Socialbakers zaměřuje na následující platformy: Facebook, Twitter, Instagram, Youtube. Veřejně měřitelný obsah může být například velikost fanouškovské základy, aktivita stránek a angažovanost jejich publika.
Datové zdroje ke zpracování do médií
Poskytnutí několika datových zdrojů k aktuálnímu tématu nebo využití veřejně dostupných datových zdrojů, konzultace výsledků (především statistického zpracování datové analýzy a interpretací výsledků).
Presence of Czech media (newspaper, online news) on Facebook and/or Twitter
Focus:keyword analysis, affinities of followers, overall activity (shareability, sentiment, most shared articles via social), differences between platforms (Twitter tends to use specific group of users in CZ)Platforms:Facebook and Twitter
Datasets: 1) Facebook posts a) Fields: created time, message, total interactions, attachment, external link, post link, reactions, sentiment, post type b) Time range: 2019 c) Scope: posts of max 8 selected media (example: idnes, ihned, lidovky, novinky, aktualne) d) Security: public data from SBKS database posts 2) Twitter a) Fields: created time, message, total interactions, mentions, hashtags, attachment, external link, tweet link, sentiment, post type b) Time range: 2019 c) Scope: posts of max 8 selected media (example: idnes, ihned, lidovky, novinky, aktualne) d) Security: public data from SBKS database 3) Media followers a) Fields: follower id, following ids, following names, following handles, following sbks tags b) Scope: List of following for random Czech 1000 followers of max 8 media c) Security: public data from Twitter proxy, tags from SBKS database
US Election/Politics
Focus: analysis of potential presidential candidates, affinities of followers, followers overlap, mentions in media... with the goal to select the most probable opponent to Donald Trump in 2020 election.Platforms: Twitter
Datasets: 1) Followers of selected candidates (max 20) a) Fields: profile id, followers ids b) Scope: List of followers (ids) for selected profiles c) Security: public data from Twitter proxy 2) Twitter posts by selected US media that include mentions (or name) of selected candidates (max 20) a) Fields: created time, message, mentions, hashtags, sentiment b) Time range: 2019 c) Security: public data from SBKS database 3) Political affinities a) Fields: follower id, following ids, following names, following handles, following sbks tags b) Scope: List of following for random US 5000 followers of max 8 selected politicians/parties c) Security: public data from Twitter proxy, tags from SBKS database 4) Replies to tweets and mentions of selected democr. party candidates by other candidates (max 10) a) Time range: 2019 b) Scope: posts of max 10 selected politicians c) Fields: mentions, message, sentiment, name d) Security: public data from SBKS database
Czech Politics
Focus:keywords analysis, affinities, followers overlap, overall activity (shareability, sentiment), connectivity across parties (politicians from the same party)Platforms:Facebook and TwitterDatasets: 1) Followers of selected Politicians / Parties (max 20) a) Fields: profile id, followers ids b) Scope: List of followers (ids) for selected profiles c) Security: public data from Twitter proxy 2) Facebook posts a) Fields: created time, message, total interactions, attachment, external link, post link, reactions, sentiment, post type b) Time range: 2019 c) Scope: posts of max 8 selected politicians/parties (example: Dominik Feri, ČSSD,
Piráti, Andrej Babiš, SPD) d) Security: public data from SBKS database 3) Twitter a) Fields: created time, message, total interactions, mentions, hashtags, attachment, external link, tweet link, sentiment, post type b) Time range: 2019 c) Scope: posts of max 8 selected politicians/parties (example: Dominik Feri, ČSSD,
Piráti, Andrej Babiš, SPD) posts d) Security: public data from SBKS database 4) Twitter a) Fields: created time, message, mentions, hashtags, sentiment b) Time range: 2018-2019 c) Scope: mentions of max 8 selected politicians/parties (example: Dominik Feri,
ČSSD, Piráti, Andrej Babiš, SPD) d) Security: public data from SBKS database 5) Political affinities a) Fields: follower id, following ids, following names, following handles, following sbks tags b) Scope: List of following for random Czech 1000 followers of max 8 selected politicians/parties c) Security: public data from Twitter proxy, tags from SBKS database
Other Topics
If anything in
► Stručná charakteristika předmětu:
Cílem volitelného semináře, jehož odborným garantem je Středisko žurnalistiky umělé inteligence při IKSŽ FSV UK, je seznámit studentky a studenty s problematikou datové analýzy, včetně jejího následného zpracování do žurnalistických obsahů. Seminář se skrze případové studie zaměřuje na problematiku přístupu k datům (tzn. způsoby stahování, příklady veřejně dostupných dat v českém prostředí apod.), dále na zpracovávání dat, dostupné nástroje a interpretaci (tzn. nejčastější chyby v interpretaci u žurnalistů, špatné příklady z médií). Závěrečnou částí semináře je praktický workshop na příkladu datových zdrojů z Národního katalogu otevřených zdrojů. Účastníci semináře budou rozděleni do redakčních týmů, v nichž se naučí identifikovat klíčová témata a osobnosti sociálních sítí, datovou analýzu, správnou vizualizaci dat, včetně možných úskalí. Výstupy workshopu budou publikovány na webových stránkách Střediska žurnalistiky umělé inteligence.
► Jména vyučujících: Václav Moravec, Veronika Halámková
► Rozsah výuky: 0/2 ZS
► Podmínky zapsání předmětu: přijetí do magisterského studia
► Podmínky pro úspěšné zakončení semináře: 1) aktivní účast v semináři doplněná studiem povinné i doporučené literatury, ověřováno průběžně (40% z celkového hodnocení), 2) zpracování předmětné datové analýzy do publikovatelného textu na webových stránkách Střediska žurnalistiky umělé inteligence (60% z celkového hodnocení). Nesplnění jedné ze dvou výše uvedených podmínek znamená neúspěšné ukončení předmětu.
► Počet kreditů: 4