Rozpis témat
Následující témata budou při vyučování pokryta. Každý vyučující má individuální přístup k rozvržení hodin (pořadí témat) i v důrazu na jednotlivá témata.
- Co je korpus; korpusy ČNK
- Korpusová lingvistika
- Otázka reprezentativnosti psaných a mluvených korpusů, žánrová rozrůzněnost
- Značkování korpusu - lemmatizace a morfologické značkování; struktura korpusu
- Vyhledání a interpretace konkordance
- Frekvenční analýza (lemmat, slovních tvarů, žánrů, kontextu apod.)
- Pokročilé vyhledávání: CQL a regulární výrazy
- Kolokace, koligace, sémantická prozodie
- Korpusový materiál ve výzkumu jednotlivých jazykových rovin
- Základy zpracování dat (práce s Excelem, vytváření tabulek a grafů)
- Základy statistiky pro práci s korpusem
- Korpusové nástroje SyD, Morfio, KWords
- Specializované korpusy (Diakorp, InterCorp, autorské korpusy)
- Zpracování rozsáhlejšího lingvistického výzkumu (např. bakalářská/diplomová práce) na základě korpusových dat
Seminář je určen zájemcům o práci s jazykovým korpusem. Po absolvování semináře budou studenti schopni samostatně využívat korpusy psané a mluvené češtiny pro svou vlastní lingvistickou práci. Naučí se pracovat s korpusovým manažerem KonText a dalšími nástroji pro práci s korpusem, seznámí se s jazykovým materiálem v korpusech ČNK (především se synchronními psanými a mluvenými korpusy). V rámci samostatného výzkumu dokážou vyhledat a interpretovat lingvistický jev.
Počet studentů v semináři je z kapacitních důvodů omezen na 10.
Požadavky k zápočtu: aktivní účast na seminářích, test, samostatné zpracování lingvistického jevu korpusovými metodami.