Učení interpretovatelných latentních dialogových akcí za použití méně anotovaných dat

Publikace na Matematicko-fyzikální fakulta |

2022

Abstrakt

Představujeme novou architekturu pro modelování task-oriented dialogů vysvětlitelným způsobem. Tato architektura používá latentní proměnné pro reprezentaci dialogových akcí.

Náš model je založen na variačních rekurentních neuronových sítích a nevyžaduje explicitně anotované sémantické informace. Narozdíl od předešlých prací, naše metoda modeluje promluvy systému a uživatele odděleně a modeluje navíc i databázové dotazy, což činí model aplikovatelným na task-oriented systémy.

Tato metoda zároveň vytváří jednoduše interpretovatelné latentní proměnné reprezentující akce. Ukázali jsme, že náš model dosahuje lepších výsledků než předešlé přístupy pracující s omezenou anotací dat, pokud se týká BLEU skóre a perplexity, a to na třech datasetech.

Dále navrhujeme způsob měření úspěšnosti dialogů, který nevyžaduje anotaci experta. V neposlední řadě také představujeme inovativní způsob vysvětlení sémantiky obsažené v latentních proměnných.

Klíčová slova

učení interpretovatelných latentních dialogových akcí použití méně anotovaných