Charles Explorer logo
🇨🇿

Optimalizace třídicích algoritmů pro systémy proudového zpracování dat

Publikace na Matematicko-fyzikální fakulta |
2011

Abstrakt

Jedním ze způsobů paralelizace datových systémů je použití principů proudového zpracování. Data v takovém systému pak chápeme jako proud rozdělený na přiměřeně velké bloky, přičemž různé bloky mohou být paralelně zpracovávány různými částmi systému.

Některé operace, mezi které patří například třídění, se ovšem v proudových systémech nechovají příliš dobře, protože ke své korektní činnosti potřebují pracovat nad celými daty najednou. Tyto operace pak omezují míru paralelismu, kterého je systém schopen dosáhnout, čímž zhoršují jeho škálovatelnost.

V tomto článku představíme způsob úpravy třídicích algoritmů pro použití v systémech proudového zpracování dat, který má za cíl minimalizovat jeho negativní vlivy na škálovatelnost zbytku systému a zároveň vykazuje dobré výkonnostní vlastnosti.