Hnutí okolo tzv. digital humanities přichází jako reakce humanitních a sociálních věd na rozvoj výpočetní techniky a nových (digitálních) médií od poloviny minulého století. S nástupem počítačů se postupně objevují projekty využívající jejich výpočetní sílu a možnosti zpracovávat množství informací, kterou jsou jinak prakticky neuchopitelné jednotlivcem.Za jednoho z prvních průkopníků v této oblasti se považuje jezuita Roberto Busa, který přišel již v roce 1949 s projektem kompletního zpracování index verborum díla Tomáše Akvinského. Projekt samotný byl nakonec realizován v letech 1974–1980 v tištěné verzi 56 svazků za podpory společnosti IBM. Při projektu bylo dílo Tomáše Akvinského kompletně přepsáno do děrných štítků, z nich byla poté vytvořena počítačem úplná konkordance. Dnes je celý Index Thomisticus přístupný na webu. Díky tomu je možné během zlomků sekund vyhledat všechny výskyty daného slova v objemném díle.Tento průkopnický projekt dobře ukazuje základy přístupu v digital humanities. Byl umožněn výpočetní sílou a novými médii, mění samotný přístup k výzkumu, a konečně proměňuje i celkový přístup/interface k informacím, z nichž výzkum vychází. Právě tyto změny vymezují prostor digital humanities.Postupný nástup počítačů v druhé polovině 20. století a zejména jejich neustále klesající cena přinášejí zásadní změnu i ve vědecké práci. Při původním využívání výpočetní síly ve vědě se výzkumník potýkal s relativně drahým sběrem dat ve větším množství a s jejich poměrně finančně náročným zpracováním. Proto byl velký důraz kladen především na formulaci hypotézy a její potvrzování (případně falzifikaci). Od 80. let se však situace mění, díky dostupnému výkonu a možnostem softwaru se postupně dostává do popředí tzv. explorační analýza dat, při níž může výzkumník procházet velké množství dat tak, aby nalezl větší počet hypotéz, které stojí za to dále testovat. K technikám explorační datové analýzy patří kupříkladu multidimensional scaling, PCA, ale také běžné vizualizace jako je box-plot či scatter-plot.Původně čistě statistický přístup je doplněn o metody tzv. data miningu, tedy přístupu, který se snaží o získávání netriviálních informací z analýzy dat a který vychází především z tradic počítačové vědy. Mezi základní data-miningové techniky patří kupříkladu rozhodovací stromy, asociační pravidla, neuronové sítě, regresní analýza či shluková analýza. Náleží sem ovšem i nejrůznější formy sumarizace včetně vizualizací.
Během semináře se předpokládá aktivní zapojení do práce a průběžné vypracování domácích úkolů. Seminář je zakončen praktickým projektem z oblasti Digital Humanities.
Seminář je zaměřen na úvod do problématiky Digital Humanities a především jejich praktické aplikace. Jednotlivá témata budou propojována úvodem do programovacího jazyka R a vývojového prostředí R Studio.
Seminář nepředpokládá žádné předchozí programátorské znalosti. K výuce je třeba si nosit vlastní notebook.