Charles Explorer logo
🇨🇿

Předpovídání typologických rysů ve WALS za použití vektorových reprezentací jazyků a podmíněných pravděpodobností: řešení ÚFALu pro sdílenou úlohu SIGTYP 2020

Publikace na Matematicko-fyzikální fakulta |
2020

Abstrakt

Představujeme náš příspěvek do společné úlohy SIGTYP 2020 v předpovídání typologických rysů. Náš systém je patří do omezené části soutěže, neboť používá pouze databázi WALS.

Zkoumáme dva přístupy. Jednodušší z nich je založen na odhadu korelace mezi hodnotami rysů u stejného jazyka pomocí podmíněných pravděpodobností a vzájemné informace.

Druhý přístup je založen na neuronovém prediktoru, který využívá vektorovou reprezentaci jazyků předpočítanou na rysech z WALS. Ve výsledném systému oba přístupy kombinujeme s využitím jejich vlastního odhadu důvěryhodnosti předpovědi.

Na testovacích datech dosahujeme úspěšnosti 70,7 %.