Sintesi Introduttiva

La ricerca per quello che potremmo considerare “Authority Linking” rivela che il concetto stesso potrebbe essere un anatema moderno per i grandi sistemi di data retrieval. Sebbene il linking rimane un fattore significativo per il ranking, ci sono paradossi per lo specialista SEO da esplorare. Questo articolo è la sintesi della ricerca elaborata in diversi anni ed offre nuove definizioni di ciò che un ” Authority Link” potrebbe essere.

La scorsa settimana, a Pubcon abbiamo discusso “Authority Linking” e questo post prende in esame l’evoluzione della ricerca nel corso degli anni, suggerendo nuovi modi di guardare a quello che Google e (indipendentemente) Majestic potrebbero dedurre dal “linking”.

Ci aspetteremmo che una ricerca (formulata da un numero IP negli Stati Uniti) per la frase  “authority link definition” dovrebbe offrire risultati della ricerca moderna su ciò che costituisce “Authority”  (Autorità) quando i link sono utilizzati come fattore di ranking in Internet. In effetti i risultati della ricerca sono molto lontani da questa utopia.

Authority-Link-definiton

I risultati al mese di ottobre 2015 si dividono in due gruppi: “Hub” (risultati provenienti da siti che mirano a spiegare molti concetti e che agiscono da tramite o intermediari verso altre fonti autorevoli) e “autorità”: (siti o pagine che potrebbero essere considerate esse stesse delle fonti autorevoli). Questi risultati di ricerca sono del tutto coerenti con le ricerche effettuate molti anni fa alla Cornell University nel 1999 da Jon Kleinberg (1) su Hub e Autorità. I risultati offerti da Google non soddisfano le aspettative dell’utente. Il primo risultato “Authority” è di Moz.com, ed è in realtà una definizione di “Page Authority” – una metrica definita da Moz, non una  “Link Authority”. Altri risultati da fonti che potrebbero essere considerate autorevoli sono Julie Joyce del 2012 su Search Engine Watch, Chris Brogan del NY Times del 2008 e Webmaster world del 2005! (2)

Questi risultati offrono pagine molto vecchie per essere delle fonti informative sulle tecnologie web. È possibile che la ricerca in questi anni non si sia mossa di più e tanto da modificare questi risultati nelle ricerche di Google?

Nel tentativo ulteriore di individuare una definizione di “Authority”, la ricerca è stata limitata ai risultati di Google.com. La premessa per la ricerca era che se “authority” è stato interpretato come “Link che Google considera autorevoli”, allora Google stessa dovrebbe essere la fonte primaria per una risposta definitiva. In realtà i risultati erano popolati da risultati feedproxy (di terze parti), con un solo risultato in prima pagina scritto da Google stesso.

Authority-Link-definiton-googleQuesto risultato indirizza gli utenti verso le conseguenze a cui si va incontro nell’ipotesi di considerare l’uso di authority link. La pagina (3) cita:

• “Tutti i link attivati con l’intento di manipolare PageRank o il posizionamento di un sito nei risultati di ricerca di Google possono essere considerati parte di un link scheme …”
• “… e una violazione delle linee guida per i webmaster di Google…”
• “Ciò include qualsiasi comportamento che manipola link al tuo sito o link in uscita dal tuo sito.”

Ciò suggerisce che Google sceglie di non accettare l’idea di “Link Authority” e, forse, suggerisce che anche discutere l’argomento mira a penalizzare coloro che agiscono per sviluppare authority links. Ma allo stesso tempo, il fatto che esistono avvertimenti suggerisce che Google si affida ancora molto ai link nei suoi algoritmi e quindi i link restano un fattore di ranking rilevante e significativo.

Questo pone la questione se la ricerca condotta a partire dagli studi di Cornell (Kleinberg) si sono orientati su temi in cui il termine “Link Authority” ha perso di significato.

Un Link da una “Authority” Ridimensiona quella Authority

Uno paradosso della teoria HITS si riflette anche negli algoritmi di Majestic. Né Majestic né l’algoritmo o l’approccio HITS cerca di emulare i risultati di Google, ma entrambi cercano di capire e misurare il concetto di Authority in autonomia rispetto a Google che pur arriva a trarre le sue conclusioni. Nell’approccio HITS, le Authorities tendono a linkare molto meno ad altre Authority rispetto a quanto ipotizzato dagli algoritmi della prima generazione avevano previsto (Garfield’s “Impact Factor” et al (4) ). Gli hub invece tendono a linkare in modo coerente alla Authority. L’Algoritmo di Trust Flow (7) (Majestic 2014) considera anche un link ad una pagina web come un segnale di Trust, ma solo se il collegamento in ingresso proviene da una pagina considerata affidabile. In tutte e tre le metodologie, più link da una pagina riducono l’impatto che l’Authority conferisce attraverso i link.

Popolarità <> Autorità

Un chiaro segnale che Google non crede necessariamente ai propri risultati organici quando si tratta di definire una “Authority”, si trova in un video di Matt Cutts (Google, 2014) (5), dove egli osserva che un authority website, per esempio, un organo legislativo di controllo verticale, potrebbe non risultare come un sito popolare. Questo non sarebbe un risultato accettabile per le ricerche su Google nella maggior parte dei casi, e l’Organo legislativo dell’esempio precedente di fatto non riceve molti visitatori. Tuttavia rimane l’autorità in materia.

La ricerca moderna si muove verso la misurabilità del contesto

C’è una divergenza di approccio tra Majestic e Google sul tema “Authority Link”, mentre permane una significativa sovrapposizione di riscontri per Majestic come ricerca di segnali utili per identificare pagine dalle quali ottenere un link per un dato paniere di contenuti web. Google ha acquistato Freebase nel 2010 – un enorme dataset che ha cercato di registrare le informazioni relative a entità, piuttosto che pagine web. Successivamente è stato accantonato nel 2015 (a quanto pare a favore di Wikidata). Freebase si muove verso l’individuazione di entità nel web. Una pagina web potrebbe essere un’entità – o forse un contenitore per un insieme di entità. In quella pagina, molti altri oggetti potrebbero essere identificati … e l’indicizzazione della pagina potrebbe contare le citazioni e valutare anche la rilevanza (pertinenza) di queste entità.

Il concetto di entità si manifesta soprattutto nello sviluppo del Knowledge Graph di Google, un database di fatti, dati ed informazioni, invece di una collezione pura di pagine web. Si potrebbe ragionevolmente supporre che Google ritiene di poter fare meglio di altri hub su internet, fungendo da hub, utilizzando il knowledge graph, favorendo la presenza di hub nei suoi risultati di ricerca. Tuttavia, le entità del knowledge graph sarebbero esse stesse un segnale naturale di qualità, in quanto le stesse entità puntano (link) a pagine web che sono le manifestazioni ufficiose ed ufficiali di tale entità. Ad esempio, se l’entità è una società, la registrazione dell’impresa potrebbe puntare al sito aziendale e al profilo Twitter della società.

Un articolo prodotto dalle attività di ricerca di Google (6) spiega come Google potrebbe identificare questi casi di entità nell’indicizzare una pagina web, ma anche referenziare tali istanze all’ entità nel database stesso. L’articolo presenta il seguente esempio ”

tyco international

In questo esempio, sono state identificate molte entità … Manhattan, David Boies e il SEEC, ma Tyco International e PriceWaterHouse sono stati scelti come “Salient” in questo articolo. Il record Freebase poi identifica questi con un record specifico su Tyco International, dove si registrano ulteriori dettagli. Quindi, in questo caso, una menzione di Tyco International e link in essi saranno classificati come “Salient”, sarà un voto per Tyco, non necessariamente un voto per la pagina a cui è diretto il link!

Questo articolo non suggerisce né tantomeno propone causalità tra un’entità definita da Google e un link da una pagina che cita tale entità in maniera saliente, ma suggerisce ulteriori considerazioni pensando che queste citazioni (link) possono essere considerate più rilevanti in quanto provenienti da pagine contenenti entità salienti e misurati.

Indipendentemente dalla interpretazione di Google di “Authority Link”, Majestic considererebbe un link come autorevole solo nel contesto di topic  rilevanti.

Come Majestic cerca di misurare Context

La ricerca di cui sopra di Google sembrerebbe confermare la teoria secondo cui il link building dovrebbe essere più mirato allo sviluppo di relazioni e meno alla costruzione di collegamenti ipertestuali. Se l’entità viene registrata in una banca dati o una tabella comunque indipendente dal dominio web a cui si riferisce, l’entità stessa guadagna autorità attraverso la citazione. Qualsiasi citazione che l’autorità dà è quindi di grande valore, nell’ipotesi che la citazione è “salient” (contestualmente rilevante).

Per la link analysis, Majestic sceglie un metodo di elaborazione che cerca di definire un link saliente (topical), classificando i siti per argomenti (topics) partendo da un insieme preliminare, meglio definito da un algoritmo simile all’algoritmo Garfield Impact per passare valore SOLO in base alle categorie (o topics) associati alla pagina. A differenza del Algoritmo HITS secondo cui gli hub linkano ad authorities mentre le Authority raramente linkano agli hub, Majestic si avvale dell’ipotesi che gli hub non sono delle autorità a meno che e fino a quando non risultano essere stati identificati come tali, e che tale autorità è “in context” ovvero rilevante ai fini del contesto. Altra ipotesi è che i link da quelle pagine si dissipano o “conferiscono” autorità a seconda del contesto.

Majestic definisce così il “Topical Trust Flow” che è un marchio di fabbrica e proteggere attivamente questo approccio.

Una definizione suggerita di un ‘”Authority Link”

Google ha ritenuto di non approfondire il concetto di “authoritative link”, pur avendo riconosciuto che i link restano un elemento fondamentale attraverso cui scoprire e capire il web. Questa volontà si è manifestata in varie occasioni, ad esempio i video di Matt Cutts. Majestic può dunque avanzare solo due definizioni di un authority link. Majestic definisce authority link come:

“Un authority link è una citazione legittima (link) da una pagina web in tema che ha, a sua volta, notevole Topical Trust Flow sull’argomento. Il Trust è la sintesi dei link esterni ed interni alla pagina”.

Una definizione nuova e meno affidabile di Authority Link dal punto di vista di Google rimane nel campo delle ipotesi, ma è offerta per ulteriori riflessioni.

“Link salienti a entità riconosciute da Google aumenterà l’autorità di quelle entità, che a loro volta possono parlare (link) come autorità per il contenuto saliente sul web.”

Sommario

Questo articolo commenta ed analizza le ricerche esistenti, anziché offrire ulteriori attività di ricerca e suggerisce:

• Autorità <> popolarità
• Google utilizza entità, link e citazioni di quelle entità che possono influenzare il ranking quando queste entità hanno link verso le pagine semanticamente simili
• Topical Trust Flow è una risorsa indipendente di Google per capire link authority contestuale

Dichiarazione e Riferimenti

Alcune delle opinioni espresse in questo articolo sono le opinioni personali dell’autore che, pur essendo rappresentante legale di Majestic, non esprime una posizione ufficiale o opinione di Majestic.

Riferimenti:

1: Jon Kleinberg, Cornell, Hubs and Authorities
2: “Link Authority Definition” as a search term on Google (Transient link)
3: Link Schemes. Google Webmaster Help
4: Garfield’s “Impact Factor” et al
5: Matt Cutts (Google, 2014)
6: Google Research  (PDF download)
7: Topical Trust Flow (Majestic 2014)

Dixon Jones
Latest posts by Dixon Jones (see all)