Aggiustare link rotti ed il ripristino di link cancellati ha molti benefici. Chi non vorrebbero riavere link di qualità che per vari motivi sono stati cancellati?

I link si possono perdere per vari motivi; qualche volta perché rimossi, altre volte perché intenzionalmente eliminati. Il Site Explorer di Majestic è lo strumento per capire i motivi che stanno dietro alla perdita di un link, facilitandone il recupero.

Sono numerose le informazioni presenti sotto l’opzione Backlink Persi di Site Explorer. Sfruttando queste informazioni si possono individuare link andati persi per vari motivi, ad esempio motivi tecnici del server (risposta http), o altro.

In questo post affrontiamo la maggior parte dei motivi per cui un link può andare perduto:

Link rimosso

Come si può immaginare questa è la causa più comune, vale a dire il webmaster ha tolto il nostro link dalla pagina – ma questo non è sempre il caso. A volte dipende dalla tipologia di sito o pagina dove si trovava il link. Al giorno d’oggi la parola d’ordine è contenuti aggiornati. Nel caso di feed RSS è naturale che il nostro link si sposti verso la fine della pagina spinto sotto la forza incessante di notizie nuove in arrivo, per poi essere eliminato del tutto. Quando il nostro bot visita la pagina si annoterà l’assenza del link.

Purtroppo i bot non sanno distinguere tra un link rimosso (come quello del feed RSS di cui al paragrafo precedente) ed un link cancellato ed è per questo che l’intervento di un analista è essenziale per capire le dinamiche. Se siamo fortunati nell’URL è presente un indizio che ci fa capire che si tratta di una pagina di feed. Se così non è, bisogna fare una ispezione visiva, facilitata dalla presenza della ruota dentata al fianco di ogni URL con cui si può aprire la pagina. Se da una parte il link è andato perduto, potrebbe apparire su un’altra pagina dello stesso sito – va visto caso per caso.

Stesso discorso per quanto concerne link derivanti da advertising. L’uso di banner in un network verrà intercettato dagli spider di Majestic ed i loro link riportati tra i backlink di nuova acquisizione: il fatto che questi link possano scomparire è una naturale evoluzione tipica delle campagne di search advertising. Questo tipo di link è facilmente individuabile perché si tratta di immagini quindi non c’è da preoccuparsi troppo!

Redirect Canonical

I tag canonical sono cosa nota a tutti e servono per dare indicazioni sulle pagine che offrono contenuti originali e duplicati. Che si tratti di una pagina pubblicata con o senza WWW oppure in http e https, bisogna fornire indicazioni ai motori di ricerca su qual è la pagina che va considerata come originale. Tenendo a mente questo ragionamento, un link potrebbe essere perso a causa del reindirizzamento che deriva da una implementazione del redirect canonical.

Risposte HTTP

HTTP 301 – Reindirizzamento permanente

Il reindirizzamento 301 indica ai motori di ricerca uno spostamento permanente di una risorsa web verso una nuova destinazione (URL). Per quanto concerne i link da una parte il link andrà perduto ma puoi aspettarti di vederlo come nuovo link acquisito nel giro di qualche giorno – dipenderà dalla frequenza di spidering di Majestic su quel sito e su quelle pagine.

HTTP 302/307 – Reindirizzamento temporaneo

Questo tipo di reindirizzamento viene utilizzato per situazioni momentanee in cui si può trovare il sito e si ha necessità di “spostare” il traffico su altra pagina per poco tempo. In questo caso non c’è passaggio delle caratteristiche del link alla pagina nuova trattandosi di una situazione momentanea – ci si aspetta che la pagina torna online nel giro di poco tempo.

HTTP 403 – Forbidden

È lo scenario in cui ci si trova quando una pagina, pur essendo disponibile sul server, non viene servita – il server si rifiuta! In molti casi scenari come questo derivano da impostazioni lato server per incrementare la sicurezza o risparmiare sulla banda bloccando i bot. In casi come questo basta una mail al provider di hosting per mettere in whitelist i bot di Majestic (MJ12bot)

HTTP 404 – Pagina non trovata

La pagina è stata eliminata. Succede spesso nella riorganizzazione di un sito che si trasforma nel tempo. Il fatto che la pagina è stata rimossa non significa che i rapporti con quel sito si sono modificati e potrebbe essere il caso di chiedere la reintroduzione del link su altra pagina dello stesso dominio – cosa abbastanza semplice da fare.

HTTP 406 – Non Accettabile

È uno scenario molto simile a HTTP 403. La risposta 406 è una dichiarazione di impossibilità di completamente della richiesta. Dal momento che i nostri bot possono gestire soltanto testo/html/xml richiediamo una risposta solo per queste tipologie di contenuti. Per gli altri casi il server potrebbe restituire una risposta 406

HTTP 500 – Errore intero del Server

Con il messaggio 500 c’è stato un errore interno non meglio specificato che richiede ulteriori approfondimenti per arrivare alla causa. Siti come http://downforeveryoneorjustme.com/ possono aiutare in casi come questi e una volta sistemato l’errore gli indirizzi che restituivano una risposta 500 possono essere segnalati per nuova indicizzazione nel URL Submitter.

Aspetti tecnici:

Timeout

Si manifesta quando la risposta del server tarda ad arrivare. Può essere dovuto da una situazione di anomalia in cui si trova la rete oppure il server.

Connect Failure

Simile al Timeout, è la manifestazione di una problematica tecnica di interruzione del servizio lato server o rete locale dove il server è installato.

Domain Name Resolution Failure

Ci sono problemi nella risoluzione del nome a dominio dovuto ad un cambio di IP, caching del DNS, impostazioni errate dei TTL, o interruzione del servizio di risoluzione di DNS – tutti motivi per i quali ci è impossibile indicizzare il sito.