Představujeme novou architekturu pro modelování task-oriented dialogů vysvětlitelným způsobem. Tato architektura používá latentní proměnné pro reprezentaci dialogových akcí.
Náš model je založen na variačních rekurentních neuronových sítích a nevyžaduje explicitně anotované sémantické informace. Narozdíl od předešlých prací, naše metoda modeluje promluvy systému a uživatele odděleně a modeluje navíc i databázové dotazy, což čin í model aplikovatelným na task-oriented systémy.
Tato metoda zároveň vytváří jednoduše interpretovatelné latentní proměnné reprezentující akce. Ukázali jsme, že náš model dosahuje lepších výsledků než předešlé přístupy pracující s omezenou anotací dat, pokud se týká BLEU skóre a perplexity, a to na třech datasetech.
Dále navrhujeme způsob měření úspěšnosti dialogů, který nevyžaduje anotaci experta. V neposlední řadě také představujeme inovativní způsob vysvětlení sémantiky obsažené v latentních proměnných.