Charles Explorer logo
🇨🇿

Zpracování jednotlivých pravopisných systémů v rámci diachronní složky Českého národního korpusu

Publikace na Filozofická fakulta |
2010

Abstrakt

Jednotlivé pravopisné systémy užívané u textů, které náleží do diachronní složky Českého národního korpusu (DIAKORP), si při jejich zpracovávání pro potřeby DIAKORPu vyžadují různé přístupy. Jiným způsobem jsou upravovány texty psané pravopisem bratrským, jiným starší rukopisné texty psané pravopisem spřežkovým, popř. primitivním.

V závislosti na používaném pravopisném systému je přistupováno ke značkování (emendacím) v transkribovaném textovém materiálu - vždy je však ve výsledných textech zachováváno maximum obsažených informací. V tomto případě jsme nuceni řešit prakticky totožný problém s poznámkovým aparátem jako u knižních edic starší české literatury, který je na rozdíl od nich nutné zapracovávat pomocí různých značek přímo do transkripce.

Pro nejstarší rukopisná díla psaná spřežkovým, popř. primitivním pravopisem platí, že jsou v DIAKORPu transkribována a při dodržování vývojových postupů češtiny převáděna na současnou pravopisnou normu bez jakýchkoli emendací (emendací je využíváno jen k zaznamenávání chybných částí pramene), které by byly včleňovány do textu. Tyto textové prameny jsou pak v rámci DIAKORPu opatřeny zvláštní značkou, která je identifikuje jako neautentické.

Jinak je přistupováno k textům psaným, resp. povětšinou tištěným tzv. bratrským pravopisem. I zde jde o převod textů na současnou pravopisnou normu (při zachování vývojových procesů tehdy probíhajících v češtině), ale vzhledem k tomu, že v textech psaných tímto typem pravopisu je už značena kvantita, diakritika a další jevy spadající do rámce pravopisu, tak je při transkripci pomocí příslušných znaků zaznamenáváno jejich nestandardní (chybné) znění.

Nikdy však nejsou odstraňovány dobové pravopisné varianty doložené v historických slovnících češtiny.