Charles Explorer logo
🇨🇿

Vizuální podobnost webových stránek

Publikace na Matematicko-fyzikální fakulta |
2010

Abstrakt

V článku uvádíme experiment se dvěma metodami pro vyhodnocení podobnosti webových stránek. Výsledky metod se liší ve způsobu přeudpořádání a shlukování množiny webových stránek.

Obě metody patří do oblasti dolování webového obsahu. První metoda je zaměřena na vizuální podobnost webových stránek.

Tato metoda segmentuje webové stránky a porovnává jejich rozvržení založené na zpracování obrazu a shodování grafů. Druhá metoda je založena na detekci objektů na základě uživatelského pohledu na webovou stránku.

Podobnost webových stránek je měřena pomocí shoda objektů na analyzovaných stránkách.