Rozšiřujeme vektorový model o informace o strukturálních vlastnostech kolekce C XML dat. V souladu s výskyty termu t v XML struktuře kolekce C reprezentujeme t vektorem vah.
K redukci jeho délky je použita forma DataGuide pro C s cestou jako jednotkou struktury. Pak je XML dokument D reprezentován maticí D vah.