L’internal linking è una delle tematiche SEO più affascinanti da affrontare. Nell’ultimo articolo che ho scritto per il blog di Majestic ho parlato dell’importanza dei link e descritta la strategia di migrazione ad un nuovo nome a dominio (clicca qui per leggerlo).
Oggi invece voglio parlare delle pagine orfane (Orphan Pages) – cosa sono, come trovarle e perché è importante tenerle a mente.

Cosa sono le pagine orfane?

Il termine “orfane” (Orphan in inglese) sta per una URL o una sotto-pagina che non è presente nella struttura di linking interno del sito. Sono URL che non possono essere trovate come tutte le altre pagine di un sito senza ricorrere a un web crawl. Questo significa che non possono essere trovate neanche dal Google Bot! Parliamo quindi di pagine che, lasciate così, non hanno alcun valore.

Come posso trovarle?

Le pagine orfane possono essere trovate in diversi modi. Con una gap analysis è possibile trovare le pagine orfane di un sito. Basta prestare attenzione a non confondere pagine Dead-End che sono pagine che hanno link incoming ma nessun link outgoing. Anche le Dead-End possono causare qualche problema, ma nulla hanno in comune con le pagine orfane.

Posso trovare pagine orfane con i backlink?

La cosa più semplice da fare per trovare pagine orfane è fare una gap analysis con il backlink data del dominio.

La combinazione dei dati del web crawl con quelli dei backlink può essere fatta in diversi modi, a seconda del tool preferito. Se sei in possesso di un crawler e di un account Majestic, puoi paragonare le URL trovate dal crawler con le pagine target dei link esterni. Per metterli a confronto e trovare pagine orfane basta aprire Excel e usare la funzione ‘SVERWEIS’ oppure ‘LOOKUP’.

Se invece sei alla ricerca di qualcosa di più pratico e devi lavorare con molti più dati puoi usare un tool come Deepcrawl. Ai dati del web crawl potrai aggiungere quelli dei backlink presi da Majestic grazie alla API standardizzata, totalmente gratuita.

È possibile aggiungere anche manualmente link data preso dal crawl (fino a 100MB). Ciò che ne risulta è una panoramica sull’operato della gap analysis: se ha preso le URL dal web crawl o dal backlink data.

Nel migliore dei casi, il report assomiglierà a questo perché non avrà trovato alcuna pagina orfana con backlink data:

Può succedere di trovare nel report delle URL che rappresentano la pagina orfana ricercata. Queste URL vanno analizzate per stabilire:

a) Se sono URL di valore;
b) La loro reale provenienza;
c) Il loro potenziale, ovvero se vale la pena migliorarle;
d) Se è il caso di eliminarle del tutto.

Visto che ora sappiamo come trovare le pagine orfane, cerchiamo altri modi per approfondire la ricerca (solo una piccola nota, Deepcrawl è stato usato anche per questo).

Trovare pagine orfane con la Sitemap

Quello della sitemap è uno dei metodi più semplici che pochi usano. È bene controllare che la propria Sitemap sia completa: spesso non viene analizzata per vedere se ci sono URL che non possono essere trovate da un web crawler.

Può succedere quando una nuova pagina viene creata che si genera una sitemap ma non si collega alle altre pagine con link interni; oppure una pagina viene rimossa dal linking interno ma non avviene l’adattamento automatico della sitemap. Esistono dei tool per analizzare e risolvere questo problema. Non deve trattarsi per forza di un numero elevato di URL, come mostra la screenshot che segue.

Adesso che abbiamo scoperto pagine orfane con le Sitemap, analizziamo un altro dataset molto interessante che può essere sfruttato.

Trovare pagine orfane con Google Search & Analytics

Questo confronto è il più interessante, visto che i Google Data sono molto usati. Se si riuscisse a trovare pagine orfane mettendole a confronto con i dati di Google Search & Analytics, l’importanza della scoperta è più rilevante rispetto all’analoga scoperta con sitemap.

È più importante perché si è certi che Google conosce la URL e che non esiste un link interno. Ovviamente, non si parte dal presupposto che si tratti di una differenza di URL (che potrebbe essere causata dal crawler) e che tutte le URL possono sempre essere indicizzate.

Vuoi altri modi per trovare pagine orfane? Ecco altre idee interessanti.

Trova pagine orfane con i log file

Se possibile, trovare pagine orfane con i log file è meglio rispetto a trovarle con Google Search Console & Analytics.
Perché? Perché i log file contengono dati server-side che sono molto precisi mentre i dati contenuti da GSC sono spesso un’incognita.

Se sono disponibili i log file, puoi utilizzarli per fare un confronto sperando che il risultato sia simile all’immagine riportata qui di seguito, che è uno scenario abbastanza allarmante.

Se ancora non hai abbastanza idee per trovare pagine orfane, puoi sempre esportare tutte le tue pagine attive e metterle a confronto con le URL trovate dal web crawl. Può sorprendere la presenza di pagine orfane.

Ci sono tanti motivi per la presenza di pagine orfane.

Perché esistono le pagine orfane?

Abbiamo già discusso molto su come scoprire le pagine orfane, ma non ancora sul perché esistono le pagine orfane. Ecco alcune cause possibili:

  • La rimozione di pagine dal linking interno senza essere disattivate del tutto.
  • La creazione di ‘Pagine test’ per il sistema shop, per eseguire ad esempio test A/B. La persona che conduce il test non avvisa circa l’esistenza delle URL.
  • L’esistenza di URL di un CRM vecchio, precedentemente utilizzato, mai disattivate.
  • Landing page per temi stagionali/in tendenza che non sono mai state disattivate.
  • L’uso sbagliato del CMS che ha generato le pagine.
  • Categorie messe offline non reindirizzate.
  • La semplice dimenticanza di gestire pagine durante una migrazione.

Quali problemi causano le pagine orfane?

Una pagina orfana, oltre a provocare un index poco curato, può causare dei problemi con il keyword targeting di un dominio. Per esempio, oltre alle URL delle keyword principali delle pagine orfane, non si può sapere con precisione quali keyword sono collegate o sono varianti di una stessa keyword (ad esempio frigo o frigorifero).

Un altro problema piuttosto comune è la presenza di una URL errata che, pur non avendo collegamenti interni, può tuttavia essere indicizzata nell’historcal index in modo migliore a discapito delle nuove pagine ottimizzate (sì, capita anche alle pagine di non essere reindirizzate!). Questo può causare una notevole perdita di efficienza dei propri backlink.

Bisogna verificare la presenza di traffico che queste pagine possono generare – infatti è bene mettere a confronto i dati della GSC. Tuttavia, va anche tenuto a mente che le pagine orfane possono causare dei “disturbi” alla struttura di linking interna del sito se, per esempio, una pagina orfana si inserisce con dei link nella struttura esistente. Ciò significa che la pagina orfana ha link ad altre pagine che a loro volta saranno danneggiate perché linkate dalla pagina orfana.

Infine, se ancora non hai analizzato il tuo dominio per verificare la presenza di pagine orfane, ora sai cosa sono, sai perché è importante farlo e come farlo. Spero che non ti debba trovare mai in una situazione simile a quella dell’immagine seguente:

Perché è importante tenere a mente le pagine orfane?

Da un punto di vista SEO, le pagine orfane sono delle pagine che potrebbero avere dei contenuti di valore e quindi rappresentare una opportunità di ottimizzazione, che a sua volta significa opportunità di incrementare il valore di Trust Flow e recupero di credibilità digitale che altrimenti andrebbe persa.

Mettiti all’opera! Cerca le tue pagine orfane adesso!

THANK YOU!
If you have any questions in the meantime, please contact help@majestic.com
You have successfully registered for a Majestic Demo. A Customer Advisor will contact you shortly to schedule a suitable time to connect.