V článku zkoumáme audiomateriál shromážděný crowdsourcingovými metodami na české sekci portálu Forvo.com (2008-2021), jenž je hodný pozoru z vícero hledisek: svým rozsahem i dosahem, jazykovou rozmanitostí - a v neposlední řadě vcelku ojedinělou variabilitou výslovnostních realizací. Stránky porovnáváme s některými dalšími vícejazyčnými databázemi audionahrávek a dotýkáme se částečně dichotomického vztahu mezi zamýšlenou koncepcí stránek a její skutečnou podobou.
Dále stručně charakterizujeme český seznam položek a shrnujeme výhody a nedostatky dostupných dat pro vědecké účely. Nakonec se zamýšlíme nad typickým uživatelem portálu, a to jak nad poskytovatelem zvukových dat (mluvčího), jehož řečové chování je zřejmě ovlivněno specifickou řečovou situací v průběhu nahrávání, tak nad nerodilým laickým příjemcem dat (posluchačem), který je plně závisl ý na důvěře v reprezentativnost konkrétních výslovnostních variant.
Rovněž definujeme termín reprezentativnost, který v našem následujícím článku slouží jako jako hodnoticí rámec pro fonetickou analýzu nahrávek.