Data distribution from study

Abbiamo analizzato i dati di circa 6,5 milioni di siti web per stabilire un valore medio di riferimento per il numero di backlink che puntano una pagina web posizionata su una pagina. La risposta potrebbe sorprenderti.

In media e nella maggior parte dei casi, una URL stabilisce un link ad altra URL una sola volta. In altre parole molte pagine tendono ad avere in media un solo link da un’altra URL.

In questo post esaminiamo i dati per condividere con voi come siamo arrivati a questa conclusione!

Per questo studio abbiamo preso in considerazione due valori esaminati per ogni dominio del campione – Il conteggio delle URL esterne di riferimento e quello dei backlink entranti così come mostrato nella sezione dove i link vengono riportati nel Site Explorer.

Backlink breakdown section from Majestic Site Explorer

Abbiamo calcolato il rapporto dei due valori per ciascun dominio del dataset. Vediamo cosa ci hanno raccontato i numeri.

Dai valori medi alle distribuzioni

Siamo partiti con circa sei milioni e mezzo di record di domini top del nostro dataset. Abbiamo messo a confronto i conteggi evidenziati nel report di Site Explorer.

I valori a cui facciamo riferimento sono: La somma di tutti i backlink che putano ciascun dominio e quella di tutte le URL che hanno almeno un backlink. In altre parole, abbiamo un rapporto pe ciascun dominio che misura l’impatto dei link supplementari sul dataset.

Possiamo quindi fare dei calcoli sui milioni di rapporti che abbiamo calcolato per determinare il valore normale di link supplementari per un dato dominio.

Prima di analizzare i dati facciamo alcune considerazioni su questo studio e come lo abbiamo presentato.

Sono ben documentati i pericoli a cui si va incontro quando ci si affida troppo ai valori medi. Per questo abbiamo verificata la distribuzione dei rapporti nei siti che sono stati testati. Un modo utilizzato per illustrare questo approccio è mediante l’uso di un box plot che analizza la mediana ed i quartini più bassi e più alti. Un quartale è semplicemente una media delle metà più alta e più bassa del dataset.

Box / Scatter plot showing outliers

Sfortunatamente, questi dati sono piuttosto distorti dai valori anomali e il grafico a dispersione sembra piatto. Ingrandiremo il grafico tra un momento, ma per ora concentriamoci su alcuni degli outlier.

RatioNumero di Domini
>53014
>1023
>259
>502
>1001

Il numero di domini con un rapporto superiore a 5 è di 3.014. Quest’ultimo numero potrebbe sembrare significativo, ma è importante considerare le dimensioni del dataset. Considerando la scala di questo studio, 3.014 sono meno dello 0.05% – meno di un ventottesimo di punto percentuale in relazione ai dati esaminati.

Un’analisi manuale di alcuni di questi outliers ha messo in evidenza che sono attribuibili ad un fenomeno chiamato “TLD Correction”. Per alcuni siti, dove si sono riscontrati molti sottodomini, Majestic prende in considerazione link ai sottodomini nel conteggio del TLD.

distribtion of URL:Link relationships where ratio < 10

Facendo uno zoom sui dati, notiamo come si stringe la distribuzione dei rapporti tra le grandezze in esame. Sembra esserci ancora molto rumore. possiamo visualizzare i rapporti in maniera diversa per capire dove si posiziona la maggior parte dei dati.

Percentual dei rapportiValore massimo del rapporto (backlink per URL)
90% dei rapporti1,28
95% dei rapporti1,51
99% dei rapporti1,99
Illustrazione degli intervalli dei dati (minimo: 1)

La maggioranza schiacciante dei domini esaminati nel nostro dataset aveva meno di due backlink per URL, con un numero elevatissimo di domini con molti meno.

Ciò non significa che non si ricontrai la presenza di più di un link allo stesso URL. I dati suggeriscono che link multipli non sono frequenti. Pagine con più backlink sono una rarità con la maggior parte delle pagine che, mediamente, hanno poco più di un link.

Avendo stabilito il valore di riferimento più basso ed un limite ragionevole per rappresentare un box plot, possiamo esplodere la linea arancione del grafico precedente per illustrate il quartale inferiore, mediano e superiore del dataset.

La box plot mostra che per il 75% dei domini testati, il rapporto tra URL e backlink nel web è compreso tra 1:1 e all’incirca 1:1,103. Trascurando gli outliers descritti la box plot ci mostra l’intervallo tra quartini più bassi e più alti. In questo esempio, il valore inferiore è pari ad 1 e coincide con il valore minimo. E questo succede perché una URL non può avere un link ad altra URL senza la presenza di almeno un link.

Per molti dei domini che sono stati valutati, l’impatto dei backlink supplementari appare trascurabile. La Box Plot ci dice che per molti domini le URL che hanno più di un link esterno ad una data risorsa è dell’ordine di 1:100.

Come abbiamo calcolato i totali ed i rapporti

Majestic indicizza il web su scala globale per conoscere le interconnessioni dei siti web. I dati prodotti da quest’attività sono analizzati per calcolare il Trust Flow e Citation flow, ma anche altre informazioni come il numero di backlink, in particolare:

  1. Il numero complessivo di URL con backlink
  2. Il numero complessivo di backlink (ci sarà almeno un link per ogni URL che ha un backlink)

Link esterni e URL esterne sono link provenienti da altri siti (non lo stesso che ospita la pagina web in esame).

I totali sono calcolati a livello di dominio. Per ciascun dominio si calcola prima il numero di link esterni per URL e per link individuale. Questi numeri vengono quindi sommati per generare i totali a livello di dominio.

Facciamo un esempio: Se un dominio ospita 400 URL e ciascun URL avesse due backlink al tuo sito, avremmo 400 relazioni a livello di URL e 800 backlink. Questo conteggio potrebbe sembrare strano ma è importante sottolineare che il conteggio puro e semplice dei backlink è raramente utilizzato. In un caso come questo, il numero di domini di riferimento sarebbe molto basso (soltanto uno), e provocherebbe una ulteriore indagine qualora l’analisi venisse fatta da un SEO con esperienza.

Facendo un’analisi seguendo questo criterio, il rapporto tra URL e Link sarebbe di 1:2 che è un segnale molto forte che mette in evidenza la validità dell’approccio ed il beneficio che deriva dall’avere data point multipli. Questi segnali importanti possono essere messi a rischio se i dati vengono sottoposti ad elaborazioni più sofisticate per ottenne dei dati a livello di URL.

Inoltre va sottolineato come i conteggi di questo studio sono stati ottenuti utilizzando l’Indice Recente con al presenza di link di bassa qualità, con URL parametrizzate, e link cancellati. Le conclusioni di questo studio potrebbero variare al variare dei criteri di classificazione dei backlink.

Il Significato di questo studio

I dati di questo studio cambieranno la tua strategia SEO? È bene fare tutte le considerazioni del caso prima di apportare modifiche al proprio modo di fare SEO e Link Building.

Trascurando gli aspetti pratici di un esercizio come questo le domande che possono scaturire da un’attività di analisi come questa sono un aspetto importante della SEO.

Ad esempio le attività di auditing nella SEO sono all’ordine del giorno, quando si prende in carica un nuovo progetto per stabilire uno status quo.

Altre attività potrebbero essere di disavowing di backlink sospetti, anche se quest’ultima è una pratica meno utilizzata rispetto al passato.

Queste attività possono invece aiutare ad organizzare il lavoro, dando priorità alle cose più utili.

Ora ci poniamo la domanda: la conoscenza del numero di backlink per URL è un dato importante per le attività dei SEO?

Intanto possiamo dire che la usabilità del sito è un fattore di ranking. Infatti Nielsen Norman Group, azienda specializzata in questa disciplina, ha pubblicato uno studio secondo cui la presenza di link ridondanti provoca un sovraccarico cognitivo e andrebbero tolti.

Perché ci dovrebbero essere più link alla stessa pagina?

Lo studio evidenzia la rarità di questo evento pur essendoci dei casi in cui si verifica. Qui di seguito sono riportati tre esempi che illustrano circostanze che possono portare alla presenza di link multipli alla stessa URL.

La pagina presenta diversi link

È il caso che si presenta quando l’autore cita un articolo nel contesto dello stesso e poi aggiunge di nuovo il link nelle citazioni o bibliografia. Un esempio è questo articolo di Noah Glushien sulle problematiche delle persone che sono daltoniche. Nell’articolo l’autore cita una risorsa:

E poi di nuovo alla fine dell’articolo:

Analizzando questo sito con il Site Explorer si trova un link a livello di URL. L’altro link è disponibile tramite il download completo dei backlink dal menu “Actions” (Azioni).

C’è un link dall’immagine e uno testuale sulla stessa pagina

Questo caso è simile a quello precedente ed è una modalità operativa che trova impiego nei siti che utilizzando le immagini per creare dei link che poi sono ripetuti nella descrizione. Esempio tipico è quello riportato nella screenshot che segue che è un template di prodotto con immagine, un tasto che suggerisce l’acquisto, ed il titolo – tutti link che puntano alla stessa URL.

Example of multiple link types from one URL to another

Majestic riporta questi tre diversi tipi di backlink come link multipli alla stessa URL.

Da notare che in alcune circostanze, Majestic può riportare link multipli quando l’anchor tag contiene sia l’immagine che del testo. Questo succede perché Majestic modula il link e lo segmenta in due parti distinte – una relativa all’immagine e l’altra relativa al testo.

Le modalità con cui Majestic riporta redirect e canonical

Per alcuni backlink, Majestic memorizza copie multiple dello stesso link per documentare entrami le forme di reindirizzamento. Majestic tratta il canonical come una forma di redirect morbido così come illustrato nell’immagine che segue.

Per fornire dati con un elevato grado di accuratezza, Majestic fornisce dati relativi al link originale e la sua forma canonica in Site Explorer, lasciando all’utente la scelta del dato da utilizzare per le proprie analisi SEO.

Canonical “Redirect” a livello di dominio per un twitter handle

Questo esempio è piuttosto comune. Twitter implementa il canonical per avere URL in minuscolo, mentre gli utenti utilizzando identificativi (handles) misti per una migliore lettura e mettere in evidenza il Brand.

In questo esempio YouTube ha un link a twitter.com/YouTube, tuttavia Twitter implementa un canonical a twitter.com/youtube.

Il contributo di redirect e forme canoniche potrebbe essere oggetto di ulteriori approfondimenti ed è oggetto di diverse interpretazioni Aree di interesse per i SEO dove i redirect possono avere un impatto sul conteggio dei backlink è nella migrazione di un sito e l’introduzione di “https” su un sito già esistente e con URL in “http”

THANK YOU!
If you have any questions in the meantime, please contact help@majestic.com
You have successfully registered for a Majestic Demo. A Customer Advisor will contact you shortly to schedule a suitable time to connect.