V tomto článku se zabýváme identifikací výskytů víceslovných výrazů z existujícího slovníku v textovém korpusu. Víceslovné výrazy mohou být libovolné délky a přerušeny v povrchovém pořádku slov.
Analyzujeme a porovnáváme tři různé přístupy využívající lingvistické analýza na různých rovinách.