Tandemová hmotnostní spektrometrie je široce používaná metoda pro identifikaci proteinových a peptidových sekvencí ze vzorků biologického materiálu. Sekvence přitom nejsou identifikovány přímo, ale musí být interpretovány z dat zíkaných hmotnostním spektrometrem.
V tomto textu prezentujeme metodu pro interpretaci hmotnostních spekter založenou na podobnostním vyhledávání v databázích proteinových sekvencí, která využívá parametrizovanou Hausdorffovu vzdálenost. Pro dosažení efektivního podobnostního vyhledávání využíváme pro indexování databáze metrické přístupové metody a algoritmus TriGen.
Naše metoda navíc podporuje vyhledávání spekter obsahujících posttranslační modifikace, což je jedním z hlavních přínosů oproti jiným metodám publikovaným v této oblasti. Metoda může být využita pro předzpracování databáze i jinými sofistikovanými algoritmy pro interpretaci hmotnostních spekter.