ORTOFON: korpus neformální mluvené češtiny s víceúrovňovým přepisem

Publikace

Abstrakt

Korpus ORTOFON navazuje svou koncepcí sběru dat na korpusy neformální mluvené češtiny řady ORAL. Společně s korpusem DIALEKT se jedná o první dva mluvené korpusy češtiny, které disponují víceúrovňovým přepisem.

Stejně jako korpusy řady ORAL shromažďuje i ORTOFON spontánní mluvený jazyk užívaný v neformálních situacích mezi mluvčími, kteří se znají. Podobně jako v korpusu ORAL2013 pocházejí mluvčí z celé České republiky a jsou o nich shromažďovány vybrané sociologické informace.

Korpus ORTOFON je také první korpus, který je plně vyvážený v rámci všech základních sociolingvistických kategoriích mluvčích (pohlaví, věková skupina, výše dosaženého vzdělání a oblast pobytu v dětství). Korpus je lemmatizován a morfologicky značkován stejně jako korpus ORAL, transkript je propojen se zvukovou stopou.

Korpus ORTOFON umožňuje zkoumat různé aspekty mluveného jazyka, tj. lexikum, morfologii, syntax, pragmatiku, výstavbu dialogu. Korpus není primárně určen pro dialektologický 1) či fonetický výzkum, přesto zjednodušený fonetický přepis umožňuje ověřit existenci výslovnostních či regionálních variant nebo jevů souvisejících s výslovností.

Zveřejněním korpusu ORTOFON spolu se spojeným korpusem ORAL se uživatelům otvírá možnost zkoumání neformální mluvené češtiny v dosud nejrozsáhlejším komplexu dat z patnáctiletého období (2002-2017).

Klíčová slova

korpus spontánní neformální konverzace mluvená čeština ortografická transkripce fonetická transkripce