Hub and Authority

Traduzione e Integrazione delle Lezioni a cura di Sandro Gallo

Home Web Search - Page Rank Web Mining e DICE


Un altra tecnica per cercare pagine importanti è l'Hub and Authority.
Un'Authority è una pagina con delle informazioni, invece un Hub dice come raggiungere un'authority.
In questo caso si utilizza una matrice A non stocastica che in ogni posizione vale 1 se esiste un link tra i e j, cioè se i punta a j. Zero altrimenti. In pratica AT è la matrice del page rank. Indichiamo con
image not found
i vettori di authority e hubbiness, cioè i vettori che contengono il grado di authority e di hubbiness. Siano
image not found
fattori di scaling. Diciamo che la hubbiness di un sito è la somma delle authority che lui punta:
iamge not found
E l'authority di un sito è la somma delle hubbiness che lo puntano, cioè:
iamge not found
Così le due definizioni ricorsive di authority e hubbiness sono:
iamge not found
Quindi il problema si risolve calcolando gli autovettori delle matrici
image not found.


Home Web Search - Page Rank Web Mining e DICE