Tvorba datasetů pro ropzoznávání grafických znaků, především ručně psaných, je často drahá a časově náročná záležitost. Nástroj MUSCIMarker, kterým jsme vytvořili dataset MUSCIMA++ pro rozpoznávání not, pomohl omezené zdroje využít efektivně, a je dostatečně flexibilní na to, aby jej bylo možné použít na tvorbu datasetů pro další úlohy s podobnou reprezentací anotované "pravdy".
Nejprve popíšeme tuto reprezentaci, aby byla zřejmé, na jaké úlohy je MUSCIMarker aplikovatelný; následně popisujeme samotný nástroj MUSCIMarker, jeho silné a slabé stránky, a praktické zkušenosti s tvorbou datasetu MUSCIMA++.