Článek představuje vyvážený korpus ORAL2008 zachycující výhradně autentickou mluvenou češtinu. Zabývá se zejména otázkami sběru dat a jeho širokého pokrytí, systémem transkripce, a také možnými výsledky založenými na korpusu.