Obsah kurzu: 1. Definice korpusu, typologie, reprezentativnost, možnosti a metodologická omezení. 2.-3.
Základní a pokročilé vyhledávání v korpusech - na příkladu paralelního korpusu InterCorp; principy kontrastivního korpusového výzkumu. 4.-5. Významné korpusy jednotlivých románských jazyků a možnosti jejich využití. 6.-7.
Základy statistického zpracování korpusových dat (typy frekvence, frekvenční seznamy, MI-score, T-score atd.); víceslovná spojení a kolokace v korpusu. 8. Korpusy mluveného jazyka. 9.
Základní postupy stylometrie (textometrie), analýza klíčových slov v textech (keywords), textové vzorce (textual patterns). 10.-11. Praktické korpusové sondy morfologické, syntaktické, lexikálně-sémantické, pragmatické i sociolingvistické (např. morfologická produktivita v korpusu, příznakový slovosled, prostředky vyjádření epistemické modality v románských jazycích a jejich české protějšky, diskurzivní částice, derivovaná adjektiva, činitelská jména nebo kauzativní konstrukce a jejich české protějšky, výzkum jazykových variet, např. evropské a americké španělštiny/portugalštiny aj.). 12.
Prezentace studentských korpusových výzkumů a jejich hodnocení.
Kurz je teoretickým a praktickým úvodem do korpusové lingvistiky, která představuje jeden z dominantních proudů současné lingvistiky. Cílem předmětu je poskytnout studentům italianistiky, hispanistiky, portugalistiky a francouzské filologie základy k vlastní práci s korpusy, tj. s rozsáhlými počítačově zpracovanými soubory textů, tak aby byli schopni je využít jak v běžné praxi, tak pro přípravu bakalářských nebo diplomových prací.