L’argomento linking interno è uno dei più interessanti per il SEO. È disponibile un articolo complementare all’argomento che stiamo per trattare che ti potrebbe interessare e che riguarda il linking interno e migrazione a un nuovo dominio. Qui l’argomento che affrontiamo è quello delle pagine cosiddette “orfane”: che cosa sono, come individuarle e qual è la loro importanza.

Cosa sono le Pagine Orfane

Il termine tecnico “pagine orfane” descrive tutte quelle pagine che sono presente in un sito web e che sono visibili ma che non sono raggiungibili attraverso il linking interno del sito. Queste pagine possono non comparire tra quelle individuate dai software che effettuano la scansione del sito e possono essere difficili da trovare, anche per i motori di ricerca. In altre parole, queste pagine senza link interni si posizionano in un cono d’ombra e rimangono nascoste al lettore che non riuscirà a trovarle a meno che non ne conosce la URL.

Come Individuare Pagine Orfane?

Un modo per individuare queste pagine è mettere a confronto due data set diversi. Ad esempio si possono mettere a confronto le URL di una sitemap e la lista delle URL ottenute dalle Analitiche e la Search Console (di Google e Bing). Il confronto dei tre data set può identificare la presenza di pagine orfane.

Come Individuare Pagine Orfane utilizzando dati sui Backlink

Un’altra opzione è il confronto tra altri data set: le URL ottenute dalla scansione del sito e quelle presenti nel profilo dei backlink. La procedura operative da seguire dipende dal software disponibile e l’approccio SEO di chi fa l’analisi. Il confronto tra URL utilizzando il comando ‘LOOKUP’ in EXCEL può bastare per identificare pagine di questo genere.

Per siti molto grandi si devono utilizzare software come Deepcrawl a cui si può aggiungere il profilo dei backlink di Majestic con un solo click.

Upload del profilo di backlink di Majestic su Deepcrawl per individuare pagine orfane
Come aggiungere il profilo dei backlink di un sito a Deepcrawl

È possibile un upload automatico oppure manuale con un limite di 100 MB di dati. Nel migliore dei casi non sono presenti pagine orfane e il report appare come nella screenshot che segue:

Deepcrawl Report – non ci sono pagine orfane

In caso contrario, il report identifica pagine e quindi c’è bisogno di altro lavoro per determinare la natura di queste pagine e la loro importanza:

  • Queste pagine sono utili?
  • Perché sono orfane?
  • Qual è la loro provenienza?
  • Sono pagine che ci danno l’opportunità di essere aggiornate?
  • È il caso di eliminarle in quanto pagine che sono state sostituite nel corso del tempo e quindi non più utili e rilevanti per il sito?

L’Uso di Sitemap

Forse è la procedura più semplice da seguire, eppure poco utilizzata dai SEO. La sitemap, che è tipicamente generata in automatico, ci mette a disposizione una lista completa di pagine.

Search Console e Web Analytics

È il confronto dei dati tutti provenienti dai motori di ricerca, in particolare Google. Pagine orfane che emergono dall’incrocio di dati dalla Google Search Console e Google Analytics ci dice che la pagina è nota ai motori di ricerca: Forse è presente nell’indice e sta generando traffico…

I Log File

Il log file documenta tutto il traffico di un sito. È una fonte di dati che si estrae direttamente dal server e viene memorizzato in un file – il LOG FILE. I dati del Log File sono più affidabili perché generati dal server e non da software di terze parti a cui non abbiamo accesso e che per noi sono delle scatole nere. L’incrocio di questi dati con le fonti di dati fin qui presentate è un modo per individuare pagine orfane.

Altra opzione da sfruttare è il confronto tra le pagine esistenti e quelle pubblicate – se il tuo CMS mette a disposizione questi due data set.

In sintesi, non è sempre facile individuare pagine orfane. E le difficoltà aumentano all’aumentare delle dimensioni del sito. Ci possono essere varie circostanze che favoriscono la creazione di pagine senza link entranti.

Perché si Creano Pagine Senza Link Interni

I motivi che concorrono alla creazione di pagine senza link interni possono essere molteplici. Quasi sempre si tratta d’interventi manuali di autori e web master che intervengono per modificare pagine o la struttura del sito. Ecco una lista di motivi che è sicuramente imperfetta ma che suggerisce i motivi più comuni che portano alla creazione di pagine senza link entranti.

  • Pagine che sono state rimosse dal menu di navigazione e che poi non sono state rimosse dal sito.
  • Pagine di test utilizzare per verificare la fattibilità di un prototipo di landing page.
  • URL di una versione precedente del sito migrato su altro CMS e mai cancellate.
  • Landing Pages di campagne che non sono state dismesse.
  • Una configurazione errata del CMS che genera in automatico pagine web.
  • Categorie che sono state eliminate dalla tassonomia del sito.
  • Pagine dimenticate durante una migrazione.

I Problemi che Queste Pagine Possono Creare

Pagine senza link entranti creano discontinuità nel sito.

Il linking interno è molto importante per il SEO del sito. Ad esempio, pagine senza backlink potrebbero essere in competizione con altre pagine e quindi indebolire la strategia SEO per determinate chiavi di ricerca o argomenti (cannibalizzazione interna del traffico).

Pagine che per errore non hanno link interni potrebbero avere dei backlink da altri siti web e quindi posizionarsi meglio di pagine che invece sono presenti nella navigazione del sito.

A volte queste pagine possono nascondere altre pagine a esse connesse.

Pagine orfane interferiscono con la navigazione del sito interrompendola. Le implicazioni possono essere varie e qui ne abbiamo riportate le più significative.

Un ultimo aspetto da tenere in considerazione è il mantenimento di un indice ordinato: Una struttura ben curata elimina problemi di navigazione non solo agli utenti ma anche ai motori di ricerca.

L’importanza di Pagine Orfane

Da un punto di vista SEO, la presenza di pagine senza link interni può avere un impatto negativo sulle performance da posizionamento organico. Non vedono fluire Trust dalle pagine a cui dovrebbero essere collegate. E questo comporta un loro indebolimento e quindi un minor traffico organico.