Článek se zabývá hledáním vhodného formalismu pro popis prozodie pro účely strojového učení. Cílovou aplikací je modul generující prozodii pro syntézu řeči z textu.
Tento modul se naučí prozodické značky (parametry nebo symboly) z rozsáhlého korpusu. Formalismus, který hledáme, by měl být obecný, percepčně relevantní, obnovitelný, automaticky získatelný, objektivní a naučitelný.
Popsali a porovnali jsme hlavní formalismy pro popis F0, jmenovitě Fujisakiho model, ToBI, Intsint, Tilt tzv. “Glissando threshold”. Nejvhodnější metoda popisu F0 pro úlohu strojového učení je “Glissando threshold” s přidan ým zjednodušením.