Nemetrické podobnostní vyhledávání tandemových hmotnostních spekter s podporou postranslačních modifikací

Publikace na Matematicko-fyzikální fakulta |

2012

Abstrakt

Tandemová hmotnostní spektrometrie je široce používaná metoda pro identifikaci proteinových a peptidových sekvencí ze vzorků biologického materiálu. Sekvence přitom nejsou identifikovány přímo, ale musí být interpretovány z dat zíkaných hmotnostním spektrometrem.

V tomto textu prezentujeme metodu pro interpretaci hmotnostních spekter založenou na podobnostním vyhledávání v databázích proteinových sekvencí, která využívá parametrizovanou Hausdorffovu vzdálenost. Pro dosažení efektivního podobnostního vyhledávání využíváme pro indexování databáze metrické přístupové metody a algoritmus TriGen.

Naše metoda navíc podporuje vyhledávání spekter obsahujících posttranslační modifikace, což je jedním z hlavních přínosů oproti jiným metodám publikovaným v této oblasti. Metoda může být využita pro předzpracování databáze i jinými sofistikovanými algoritmy pro interpretaci hmotnostních spekter.

Klíčová slova

Nemetrické podobnostní vyhledávání tandemových hmotnostních spekter podporou postranslačních modifikací