1. Úvod do korpusové lingvistiky. Historie. Nejvýznamnější existující korpusy. Bližší seznámení s ČNK, s DeReKo.
2. DeReKo - klient COSMAS II. - základní korpusové prostředí, možnosti a nabízené funkce, zadávání dotazů a vyhodnocování výsledků, export
3. DeReKo - klient COSMAS II. - kookurenční analýza, její možnosti a meze, zadávání parametrů, vyhodnocování výsledků, export
4. CCDB - vyhledávání, srovnání s možnostmi kookurenční analýzy, vyhodnocování výsledků
5. možnosti analýzy jednotlivých lemat - diskuse nad zadanými analýzami
6. možnosti analýzy syntagmat - diskuse nad zadanými analýzami
7. možnosti analýzy ustálených syntagmat (frazémů) ? rozdíl corpus-based vs. corpus driven, diskuse nad zadanými analýzami
8. využití výsledků korpusových analýz pro lexikografické účely
9. ČNK - zadávání dotazů, nejpoužívanější funkce, hodnoty T-score, MI-score
10. Řešení základních sporných otázek - co lze a co nelze do/v korpusu zadat/najít, anotované a tagované korpusy - jejich výhody a nevýhody
11. Řešení základních sporných otázek - velikost korpusu, nabízené nástroje, usnadnění či úplné vyřešení lingvistických problémů
12. Diskuse nad vlastními analýzami studentů
13. Diskuse nad vlastními analýzami studentů - konkluze
Cvičení určené pro oba cykly studia. Cílem je seznámit studenty se současným možnostmi využití korpusů a korpusových nástrojů pro práci s jazykem. Úvod bude věnován seznámení s korpusy a korpusovou lingvistikou jakožto moderním lingvistickým směrem.
Vlastní práce se zaměří na Český národní korpus (ČNK) a korpus němčiny (DeReKo - IDS Mannheim). Studenti získají náhled do vlastní práce s korpusy se strategií corpus-based (zadávání, vyhodnocování výsledků) a zároveň poznají možnosti ?corpus-driven? přístupu (kookurenční analýza, CCDB).
Po absolvování tohoto semináře by studenti měli být schopni jak ověřovat/vyvracet své vlastní jazykové domněnky a hypotézy na základě korpusu, tak vyhodnocovat analýzy zpracované mechanicky korpusovými nástroji. Obojí by jim mělo pomoci při dalším studiu germánské lingvistiky.