I server, e così le reti che costituiscono Internet, sono come le persone: hanno le giornate che “non vanno”. Infatti, capita di non poter raggiungere un sito per i più svariati problemi. Allo stesso modo capita di non trovare una pagina a cui vorremmo collegarci. Questo articolo è una guida pratica per risolvere un errore 404. L’errore 404 di pagina non trovata è solo uno dei codici di stato del protocollo HTTP. La conoscenza di questi codici è sapere di una Clique di persone. Sono figure professionali specializzate nell’amministrazione dei sistemi e dei server. Per loro questi codici sono “pano quotidiano”. In questo articolo esaminiamo il codice di stato HTTP 404.
Perché affrontare questo argomento?
L’argomento è interessante non solo per risolvere l’errore 404, ma anche per affrontare una casistica di problemi più generale che riguardano le attività di link building per la SEO. Si tratta dei messaggi che vengono inviati dal server quando si chiama una pagina web. Pur essendo un argomento piuttosto oscuro e ostico, ne vale la pena di affrontarlo e conoscerne gli aspetti fondamentali. Questo perché i codici di stato HTTP hanno effetti pratici rilevanti. Sono talmente importanti che possono impattare in maniera significativa politiche aziendali, strategie e tecnologie impiegate. Sono aspetti che vanno ben oltre gli aspetti SEO per i quali questo errore è diventato noto.
Premessa
Prima di scrivere questo articolo, abbiamo esaminato molte guide per risolvere un errore 404 – non tutte ci risultano di buona qualità. Questo lo diciamo forti della nostra esperienza di crawling e indicizzazione del web che possiamo vantare. Per questo abbiamo deciso di condividere informazioni ed esperienza con questa guida che spiega in dettaglio:
- il problema degli errori 404 e delle pagine mancanti;
- come risolvere un errore 404 nel tuo sito;
- perché è importante acquisire informazioni sui backlink rotti delle pagine dei tuoi competitor;
- quale impatto può avere un errore 404 sul SEO.
Nel comporre questa guida abbiamo incluso diversi link a risorse di terze parti. Questi link ti potranno aiutare a capire e risolvere un errore 404 quando si presenta. Conoscenze come queste ti saranno senz’altro utili e possono dare un contributo importante alle tue competenze nel campo della sistemistica. I concetti e le definizioni introdotte in questa guida sono semplici e non richiedono conoscenze da programmatore.
Prima di lasciarti alla lettura della guida, ci teniamo a dire una cosa sui link. Li abbiamo scelti per la qualità dei contenuti del sito. Infatti, non sono link di affiliazione o che derivano da accordi commerciali: sono dei veri e proprio backlink organici.
Introduzione al Codice 404 (pagina non trovata)
In questa sezione della guida esaminiamo l’errore 404 di Pagina non Trovata. Molto spesso questo errore si manifesta anche con la scritta Page not Found. Vediamo in dettaglio:
- il significato del codice 404;
- quali sono le cause dell’errore 404;
- come si presentano le pagine con errore 404;
- perché è importante risolvere un errore 404 e la sua importanza per il SEO.
Il Significato Codice di Stato 404
In termini molto semplici e diretti si tratta di un errore di pagina non trovata (page not found in inglese). In pratica abbiamo richiesto dei contenuti al server che, al momento della richiesta, non sono disponibili. Per questo, non possono essere inviati al browser o altro applicativo che li ha richiesti. L’impossibilità di poter espletare la richiesta inviata dal browser innesca una risposta con codice di stato 404.
Non bisogna confondere l’errore 404 di pagina non trovata con l’errore di server non trovato. Con il 404 il server viene correttamente individuato, mancano i contenuti che sono stati richiesti. Con il termine contenuti ci riferiamo indifferentemente a pagine web o file.
Perché si verificano gli errori 404
Come abbiamo stabilito nel paragrafo precedente, un errore 404 si verifica quando una pagina non è stata trovata sul server. Le cause che portano ad un errore come questo possono essere tre:
- c’è stato un click su un link “rotto” che promette la connessione a dei contenuti che si trovano su un altro sito web;
- la ricerca su un motore di ricerca che propone un link. L’utente clicca su un link in una pagine dei risultati di un motore di ricerca (SERP) e si apre una pagina di errore poiché la pagina richiesta non è stata trovata;
- l’utente punta il browser (o altro applicativo web) ad un contenuto online e questo non risulta essere disponibile.
C’è una ulteriore categoria di errori di page not found, meno visibili, anzi nascosti. Sono link a contenuti o risorse che vengono chiamate dal browser e che servono a comporre la pagina web. Ad esempio, chiamate a javascript mancanti. Questi errori 404 sono documentati dal log file del server di cui parliamo più avanti.
Link Rotti
Si verifica quando un link punta a una pagina di sito web che non c’è. I motivi per cui si verifica più di frequente questo errore sono:
- i contenuti sono stato spostati o rimossi nel sito verso il quale è attivo il link;
- un errore nella creazione del backlink;
- la pagina dov’è presente il link ed è stata messa in manutenzione. Essendo offline, non è disponibile per la consultazione.
Quando si analizza un link rotto con l’obiettivo di risolvere un errore 404, bisogna conoscere PROVENIENZA e DESTINAZIONE del backlink. In termini prettamente SEO, la pagina che ospita il backlink si chiama pagina sorgente (o Source Page in inglese). La pagina DESTINAZIONE del link si chiama Target.
Pagina Sorgente e Destinazione entrambi sullo stesso sito web: il tuo
Se pagina sorgente e destinazione si trovano entrambi sul tuo sito il problema si risolve rapidamente e senza complicazioni. Conoscendo gli indirizzi delle pagine web puoi risolvere l’errore 404. Più avanti in questa guida vedremo una strategia più raffinata per la risoluzione di questo problema. Al momento consideriamo l’approccio diretto ovvero l’eliminazione del link rotto perché il contenuto a cui punta il link non c’è più. Si può correggere la URL del link nel caso di errore di implementazione. L’ultima opzione è il ripristino della pagina a cui punta il link: potrebbe essere stata rimossa per errore.
Pagina sorgente suo tuo sito web
L’altro scenario che spesso si presenta è un backlink verso un sito web di terzi che non risponde più. In casi come questo, risolvere un errore 404 può significare la rimozione del link. Tuttavia, prima di procedere con la rimozione del link verso la pagina non trovata, val la pena fare una riflessione. Bisogna ragionare sull’opportunità di sostituire quel link con uno nuovo. Questo dipenderà dal valore che si può attribuire ai contenuti della pagina a cui si è fatto il link. Si può stabilire quanto vale quell’informazione per i lettori?
Pagina sorgente sul sito web di altri
La prima cosa da fare per risolvere un errore 404 è contattare il webmaster dove si trova il link rotto. Occorre fare molta attenzione con questo approccio: quasi sempre l’approccio sbagliato perché non funziona. A pensarci bene, stai chiedendo ad uno sconosciuto di fare un lavoro a titolo gratuito, a tuo beneficio e vantaggio.
Come risolvere un errore 404 nel tuo sito web
Se un link rotto che punta al tuo sito punta una pagina sempre dello stesso sito, potresti implementare un reindirizzamento 301. Così facendo si recupera il link. L’implementazione di una direttiva 301 dipende dal server del servizio di hosting e va verificato caso per caso. Bisogna consultare il webmaster o il sistemista che ha configurato il server e/o il sito web.
Molti ritengono che i link rotti su un sito di terzi non è affar loro. A pensare bene, potrebbe rappresentare una doppia opportunità. Da un lato c’è l’opportunità di poter risolvere un errore 404 segnalando la presenza del link rotto al webmaster. Contemporaneamente si può sviluppare una opportunità di link building. Infatti, si potrebbe proporre un contenuto alternativo a quello andato “disperso” per via del link rotto. Questa strategia è una opzione per fare link building per la SEO.
URL di un sito web inserita manualmente
Pur essendosi stabilito come il media di riferimento il web è complementare alla carta stampata. Giornali e riviste sono ancora molto letti e rappresentano uno dei mezzi attraverso cui generare traffico diretto sul sito web. Infatti, s’incontrano spesso URL di siti web in pubblicità tradizionale di riviste e giornali. Un utente, interessato da un annuncio deve digitare manualmente un indirizzo web per raggiungere una pagina di offerta. Le URL per un sito web su carta stampata devono essere corte e facilmente memorizzatili e quindi trascrivibile dall’utente. Di certo non possiamo implementare dei parametri di tracciamento come l’UTM!
Quest’ultima considerazione ci porta al secondo punto di riflessione: le persone commettono errori. Se viene pubblicizzata una URL dobbiamo assicurarci che la URL è corta, unica e facile da ricordare. Gli accessi canalizzati su una URL come questa possono essere reindirizzati verso altre pagine del sito. In casi particolari si può ricorrere anche al QR code. Bisogna evitare ogni tipo di carattere come il trattino alto e quello basso, oppure gli spazi.
Infine, c’è da considerare gli errori 404 che possono essere generati dalla curiosità dell’utente. Le persone possono essere spinte dalla curiosità di “scoprire” delle pagine riservate. Anche queste considerazioni possono incidere sulla composizione delle URL delle pagine di un sito web.
Risorse che generano un errore 404
L’analisi dei log file individua contenuti che sono stati richieste ma che non erano presenti nel sito web. Non tutte le richieste che hanno generato un errore di pagina non trovata sono di utenti. Possono essere generati da programmi nell’ambito delle operazioni di routine per il funzionamento del sito web. Nella maggior parte dei casi non c’è bisogno di arrivare a questo livello di dettaglio. Per esempio, alcune delle risorse che ritroviamo nei log file sono:
- Il file robots.txt. I bot “buoni”, quelli dei principali motori di ricerca e quello di Majestic, devono verificare la presenza di questo file. Ne leggono i contenuti prima di indicizzare i contenuti del sito web. Infatti, nel file robots.txt sono riportate le istruzioni per controllare gli accessi dei motori di ricerca al sito. Il sito robotstxt.org offre informazioni dettagliate per la configurazione di questo file, concepito per regolamentare l’indicizzazione e l’accesso ai contenuti di un sito web;
- La Favicon – il logo miniaturizzato che ogni browser può visualizzare al fianco del titolo di pagina;
- La Sitemap. È uno strumento importante per fornire ai motori di ricerca tutte le URL del sito con informazioni sul loro aggiornamento;
Ci sono altri contenuti meno noti che possono generare questo tipo di errore. Uno di questi sono gli script a cui abbiamo già accennato. Si tratta di un argomento poco rilevante per definire la strategia per risolvere un errore 404 e fare link building per il SEO.
Crawler e bot che cercano le vulnerabilità di un sito web
Prima di passare ad altro argomento, val la pena esaminare gli aspetti legati alla sicurezza di un sito web. Analizzando i log file di un sito si possono individuare i bot. Questi effettuano scansioni approfondite per individuare la presenza di vulnerabilità del sito per comprometterlo. Un lavoro importante e troppo spesso sottovalutato per abbattere i costi dei servizi di hosting.
Le caratteristiche di una pagina 404
Le caratteristiche di una pagina 404 variano. La catena degli eventi che portano all’errore 404 l’abbiamo descritta all’inizio di questa guida. Nella sua versione standard di base, la pagina 404 annuncia all’utente che la risorsa cercata non è presente nel server. Quest’ultimo invia di un messaggio standard: “la URL richiesta non è stata trovata sul server”. Molti di voi avranno già incontrata questa pagina standard di errore 404 che si presenta così:
L’immagine precedente è la screenshot della pagina standard 404 del Web Server Apache. Questa pagina è personalizzabile e consente di gestire eventi imprevisti come quello di pagina non trovata. Con questa pagina offriamo all’utente una pagina alternativa per accedere ad altri contenuti. Nell’immagine che segue c’è la screenshot dell’errore 404 di Majestic:
Pagine 404 sono una opportunità. Evitiano la dispersione di traffico che arriva nel sito ma che non ha trovato quello che cercava. Nel sito di OnCrawl trovi una lista delle migliori pagine 404 online oggi.
Come Realizzare una pagina per l’errore 404
Ci sono molti motivi per creare una pagina personalizzata da utilizzare al posto di quella standard. In primo luogo l’esperienza di navigazione dell’utente. Tecnicamente, la personalizzazione si implementa in maniera diversa a seconda del sistema di gestione dei contenuti. In pratica è una pagina come tutte le altre. Nella documentazione di Google è disponibile una sezione dedicata su come realizzare una pagina 404. I suggerimenti offerti si possono riassumere così:
- evidenziare che la pagina cercata dall’utente non è disponibile. Scusandoci per l’inconveniente, possiamo invitare l’utente a continuare la sua navigazione consultando altre pagine del nostro sito;
- garantire continuità nel branding e nella navigazione del sito;
- mettere a disposizione dell’utente contenuti utili, per compensare la non disponibilità della pagina cercata;
- prevedere un servizio per segnalare i link rotti;
- evitare che le pagine 404 vengano indicizzate dai motori di ricerca
Sono tutti punti importanti che bisogna considerare per creare la pagina e risolvere un errore 404. Gioca un ruolo predominante l’aspetto dell’usabilità e come accompagnare l’utente nella navigazione. Bisogna evitare che l’utente clicchi sul tasto “indietro” per andare su un altro sito web.
Oltre alle linee guida di Google, ci sono due documenti interessanti per chi volesse approfondire questi aspetti di usabilità:
- Le linee guida di design per i servizi web della Pubblica Amministrazione
- Linee guida di usabilità per redattori di contenuti per siti web
Le Pagine di errore 404 non sono dannose
È una domanda frequente che viene posta spesso dai SEO junior e web designers alle prime armi. La risposta è no. Al contrario, è un evento che accade spesso. I siti web sono delle entità vive e dinamiche e gli errori come questo sono inevitabili. Quando succede, il problema va risolto nel più breve tempo possibile per i motivi descritti fin qui. Basti pensare all’impatto negativo che i link rotti possano avere sulle vendite.
Non bisogna confondere link rotti con pagine mancanti che sono una conseguenza delle vicissitudini di un sito web. Se create a regola d’arte, pagine 404 le possiamo trasformare in opportunità di business da un’attività di manutenzione.
A pensarci bene, le pagine 404 hanno un equivalente nel mondo fisico. Ad esempio, quando un cliente entra in negozio oppure chiama al telefono, chiedendo di un prodotto che non c’è. Per alcuni è una opportunità di entrare in contatto con un nuovo cliente. Per altri è una seccatura e perdita di tempo. Lo stesso principio vale per le pagine 404.
Non tutt’i web server prevedono pagine 404
Come per molte altre cose nel SEO (e nella vita) non c’è una soluzione unica. Infatti non sempre una pagina 404 è, in effetti, una vera pagina. Quando richiediamo un contenuto da un sito web, il server invia al browser due insiemi di dati. La prima parte è di intestazione di pagina (HTTP header), la seconda il corpo (HTTP body). L’HTTP header contiene “comunicazioni di servizio”. Sono informazioni necessarie per la composizione della pagina ma che non sono visibili all’utente che naviga il sito web. La parte HTTP body è il contenuto della pagina, visibile all’utente, in formato HTML.
Codici di stato HTTP: 200, 400 e 418: “I’m a teapot”
Il codice di stato HTTP del server si può vedere nell’intestazione di pagina. Se la pagina è presente il server risponde con un codice 200 “ok” ed invia il contenuto. Se al contrario la pagina non è disponibile, il messaggio del server è un codice 404 di “pagina non trovata”. A titolo di curiosità simpatica è stata ufficializzato un codice 418 “I’m a teapot” ovvero sono una teiera! È una risposta alternativa al 404 da utilizzare per non rispondere a determinate categorie di chiamate inviate al server. Ad esempio rientrano tra queste le query automatizzate di bot.
Nascondere gli errori 404?
Torniamo al codice 404 e HTTP header. I web server sono altamente configurabili e flessibili. I webmaster hanno facoltà di personalizzare gli eventi quando si verifica un errore 404. Ad esempio, si può reindirizzare automaticamente l’utente ad altra pagina. Allo stesso tempo si può inviare un messaggio personalizzato e inviare un codice 200 al browser.
Perché così tanta attenzione per nascondere un 404? Perché sono cose che succedono e sono causate da racconti nei forum che diventano una prassi e “vanno di moda”. Infatti, alcuni anni fa, c’è stato un dibattito acceso tra SEO a proposito delle pagine 404. Il risultato è stato questa tecnica creativa appena descritta.
Oggi questa tecnica di nascondere gli errori 404 di pagina non trovata è passata di moda. E questo per fare un esempio di quello che si dice del SEO nei siti web e nei forum. C’è poi una ulteriore considerazione fare. Questi reindirizzamenti automatici possono generare una notevole quantità di traffico parassitario, con implicazioni anche sul crawl budget.
Le implicazioni delle pagine 404 sul SEO
Tutti noi scriviamo contenuti per essere indicizzati. Per essere indicizzati devono poter essere identificabili. È con questo processo che i motori di ricerca scoprono nuovi link. Una presenza diffusa di link rotti e pagine 404 può:
- avere un impatto negativo sulla visibilità del tuo sito web;
- diminuire il traffico;
- ridurre il fatturato;.
Come per ogni argomento SEO, anche i link rotti e pagine 404 sono oggetto di discussioni senza fine. Le opinioni sul loro impatto sul posizionamento organico nei motori di ricerca sono contrastanti. Tuttavia, link interni ed esterni hanno un ruolo importante nella valutazione e caratterizzazione dei contenuti. Ci potrebbero essere anche problemi di tipo commerciale. Per questo sono da prendere in considerazione tutte le opzioni per risolvere un errore 404.
Per concludere, un SEO deve disegnare una strategia che scopre i link rotti e le pagine 404. Deve saper consigliare la creazione di contenuti per ripristinare le pagine non trovate. Infine, deve saper pianificare campagne di outreaching per instaurare una collaborazione con siti web.
Come trovare gli errori 404 sul tuo sito web
Abbiamo sufficienti motivazioni per intraprendere un’azione di bonifica degli errori 404, viste le implicazioni. Adesso vediamo tecniche e strumenti SEO che si possono utilizzare per trovare gli errori 404. Andremo a verificare non solo sul tuo sito web, ma anche su quelli dei competitor. Subito dopo vediamo come fare per risolvere gli errori 404 e come prevenirne l’insorgenza in futuro.
Verifica manuale (ispezione visiva)
Navigare il proprio sito offre l’opportunità di verificare che tutto sia in ordine. Tuttavia è un metodo poco pratico per siti che superano poche decine di pagine. L’ispezione visiva porta via molto tempo ed è un’attività molto noiosa. Perché sprecare il proprio tempo in questo modo quando esistono molti software per SEO che ci possono aiutare? Software SEO come Screaming From, Site Bulb e Majestic possono individuare link rotti e pagine 404. Con questi software SEO da desktop si possono avere liste di pagine web in pochi minuti. Una persona ci metterebbe ore e ore di lavoro manuale; un’attività molto noiosa e costosa. E poi c’è l’imprevisto che deriva dall’inevitabile errore umano che si evita con l’uso di software dedicato.
Analisi dei file di log
Qualche anno fa John Muller disse su Twitter: “ci sono molte informazioni utili che si possono avere dai file di log, troppo spesso ignorati”. Vediamo cosa sono i log files e come possono aiutare chi fa SEO.
Sappiamo che una pagina web deve essere scaricata dal server prima di poter essere visualizzata nel browser. Il server è un computer il cui compito è quello di “servire” le pagine di un sito web. Le pagine web possono essere statiche e sono memorizzate nel computer. Oggi è sempre più raro incontrare siti web che abbiano pagine statiche memorizzate nel server. Al contrario le pagine del sito sono quasi sempre create dinamicamente. In questo modo, rispondono alle esigenze dell’utente che vuole vedere determinati contenuti. E in questo caso abbiamo a che fare con pagine dinamiche. Ad esempio, tutti gli Ecommerce sono siti web con pagine dinamiche che si compongono per proporre prodotti del catalogo. Infine, ci sono le pagine del carrello di acquisto. Queste pagine devono prevedere i costi di spedizione, l’applicazione di sconti, ecc.
I web server erogano questi servizi e documentano le loro attività compilando una specie di registro digitale chiamato Log File. Il Log File è un file di testo. Ogni riga del file è la trascrizione dell’invio dei dati erogati dal server. I dati raccolti nel log file possono essere personalizzati. Quelli raccolti di norma sono l’indirizzo IP del richiedente il contenuto, data e ora della richiesta nonché risorsa richiesta. C’è anche la risposta del server: un “200 OK” se la risorsa richiesta era disponibile, oppure il codice di stato “404” di pagina non trovata.
Le cose che si possono sapere consultando il Log File
Attraverso l’analisi di un Log File possiamo sapere:
- quali sono le pagine più visitate (o i contenuti più scaricati);
- il numero di visite effettuate da Google;
- quando si verificano eventi di pagina (o risorsa) non trovata;
- e molte altre cose.
Va detto che i dati dei Log File sono “sporchi” e vanno organizzati ed interpretati per capire cosa sta succedendo. L’uso dei Log File può rivelarsi un’attività complicata per un SEO con poca esperienza.
Utilizzando Majestic
Trovare pagine e risolvere gli errori 404 con Majestic è molto facile. Apri il Site Explorer e cerca il sito da analizzare. Scegli il tab “Pages” e clicca su “Crawl Result”. Quindi scegli “HTTP 404 Not Found”. Il sistema restituisce una lista di dati relativi solo alle pagine con errore 404. Si tratta di un errore 404 rilevato dal bot di Majestic.
Liste come questa si possono creare sia per siti propri che per siti dei tuoi competitor. I dati dei competitor sono utili per sviluppare una strategia di outreach con cui fare link building per la SEO. Tecniche e procedure sono identiche nei due casi.
Per risolvere gli errori 404 nel tuo sito la procedura è piuttosto semplice e veloce. Infatti, basta scaricare la lista che Majestic mette a disposizione direttamente in Excel. Trust Flow suggerisce quali sono le pagine a cui dare priorità. Qui di seguito trovi informazioni su come fare.
Altri strumenti
Per risolvere gli errori 404 puoi utilizzare gli strumenti che i motori di ricerca mettono a disposizione. Sia Google che Bing hanno una Search Console dove sono disponibili dati sugli errori 404. Con Bing è possibile effettuare una scansione su richiesta. E poi c’è il noto software SEO Screaming Frog con cui effettuare delle scansioni complete di un sito. Giova ricordare ai lettori con meno esperienza, che Screaming Frog va bene per siti relativamente piccoli. Scansioni di siti con migliaia o decine di migliaia di pagine devono essere pianificate ed eseguite con attenzione.
Come possono i link rotti ad un competitor aiutare il mio sito web?
Risolvere un errore 404 di un competitor può trasformarsi in una opportunità di link building per il SEO. Questa strategia offer due vantaggi:
- L’avere un backlink potenzialmente di valore;
- Avere traffico di qualità da un backlink contestualizzato.
Questa strategia diventa fattibile quando riusciamo ad individuare contenuti dei competitor che sono stati rimossi e che hanno backlink attivi. Possiamo contattare i webmaster di quei siti. I link rotti possono essere un’opportunità straordinaria per fare link building. Ecco una lista di cose che devi sapere per risolvere un errore 404 e allo stesso tempo fare link building:
- CHI ha il backlink attivo verso il contenuto che è stato cancellato;
- QUALI SONO i contenuti che sono stati cancellati;
- QUALI SONO i contenuti che tu hai a disposizione che possono sostituire quelli della concorrenza.
Per sviluppare questa strategia SEO hai bisogno di Majestic e Web Archive. Con Majestic analizzi i backlink e con Web Archive puoi vedere i contenuti che sono stati cancellati/rimossi. Google è utile per individuare contenuti rilevanti nel tuo sito e poi bisogna contattare i siti web con i link rotti.
Su quest’ultimo punto ognuno di noi deve sviluppare una strategia personale di comunicazione che riflette il tuo stile. Non esiste una strategia universale con cui approcciare l’attività.
Come utilizzare Majestic per trovare link rotti di un sito web
Utilizzare Majestic è facile se conosci il tuo segmento di mercato e i principali siti web dei tuoi concorrenti. Infatti, per individuare e risolvere un errore 404 basta ripetere il processo descritto prima. Usa il Site Explorer e clicca sul tab scegliendo l’opzione “HTTP 404 Not Found” nei filtri. Da qui ottieni una lista delle pagine che hanno generato un errore 404. Inoltre puoi trovare backlink alle pagine mancanti di cui sopra di cui abbiamo parlato in questo articolo.
Alcuni SEO sostengono che è un’azione meritevole risolvere un errore 404 segnalando il nostro contenuto a cui dare il backlink.
Il prossimo step è scoprire i contenuti della pagina cancellata con WayBack Machine. L’archivio nonché memoria storica del web è una risorsa importantissima! Web Archive si trova all’indirizzo https://archive.org/web/
WayBack Machine di Internet Archive per scoprire le pagine di un sito web che sono state cancellate
WayBack Machine è un archivio di contenuti che sono stati indicizzati nel tempo. Offre la possibilità di poter vedere contenuti di mesi o anni addietro.
Ad oggi, l’Internet Archive ha indicizzato oltre 545miliardi di page web ed è facile da consultare. Copia e incolla ciascuna URL di link rotti per vedere la pagina e la sua storia.
Il WayBack Machine si presenta come un calendario. Le date cerchiate in blu indicano l’esistenza di una copia della pagina a quella data. Le date cerchiate in verde indicano la presenza di redirect verso altre pagine. Il colore arancione è un errore 404. Così abbiamo l’accesso ai contenuti per valutarne la sostituzione con una nostra alternativa.
Come utilizzare Google per trovare contenuti adatti sul tuo sito web
Fin qui abbiamo descritta una strategia SEO per risolvere un errore 404 ed acquisire un backlink contestuale di valore. Adesso vediamo come individuare contenuti adatti alla sostituzione.
Ci viene in aiuto l’operatore site: di Google. con site: limitiamo la ricerca ad un solo sito. Google ci suite a capire quali pagine del nostro sito web sono le migliori da proporre. Se non ce ne fossero, dovremmo svilupparne di nuovi.
Strategie per limitare il numero di pagine con errore 404
Anche in questo caso, non esiste una procedura univoca che ci sentiamo di consigliare. Un sito web è una cosa viva che cambia in continuazione. Più i siti web sono grandi, maggiori sono le probabilità di avere errori 404. Un controllo regolare dei siti del tuo segmento di mercato può evidenziare opportunità di fare link building per il SEO.
Ecommerce – Errori 404 e strategie di prodotto
La gestione di un eCommerce vede coinvolte diverse figure professionali. Implementare una strategia come questa può risultare molto difficile. Per fare un esempio, l’azienda deve focalizzare la sua attenzione sulla vendita di prodotti che ha in catalogo oggi. Non interessano gli avvenimenti di ieri e non c’è tempo per parlare di domani. Eppure il ciclo produttivo di un catalogo può avere un impatto, positivo o negativo, sulle performance del sito.
Una strategia da prendere in esame è il mantenimento anche di prodotti non più a catalogo. Queste pagine prodotto possono attirare traffico da reindirizzare verso altri prodotti. Così come il semplice spostamento di un prodotto, variandone la tassonomia, può generare molti link rotti.
A questo proposito segnaliamo un consulente eCommerce che si chiama Luke Carthy. Ha scritto e presentato molto attorno al tema dei prodotti fuori catalogo. La lettura delle sue guide rivela molti aspetti poco contemplati nel mondo del SEO per eCommerce.
L’importanza dei link esterni per la migrazione di un sito web
La migrazione di un sito web può avvenire per diversi motivi. Ad esempio ci può essere l’esigenza di cambiare server o servizio di hosting. Ci potrebbe essere la necessità di cambiare struttura del sito. Altra necessità che si presenta spesso è migrare ad un diverso sistema per la gestione dei contenuti (CMS).
Coinvolgere un SEO con esperienza per gestire la migrazione è fortemente consigliabile. La posta in gioco è alta: perdere visibilità nei motori di ricerca. Un’attività di migrazione non controllata genera errori 404 se non si pianifica una strategia di reindirizzamento.
Piccoli errori sono tollerabili e possono essere corretti in tempi brevi utilizzando Majestic. Tutto il processo di migrazione deve essere documentato.
- Prima di una migrazione, va fatto un SEO Audit per creare una lista delle pagine più importanti del sito. Le pagine importanti sono quelle con link esterni con i più alti valori di Trust Flow.
- Una migrazione può durare anche mesi. Il monitoraggio durante tutto il periodo garantisce continuità di esercizio al sito web.
- Quando la migrazione è terminata andrebbe ripetuto un SEO Audit. Così facendo s’intercettano errori verificatisi nel processo. E questo prima che se ne accorga un nostro competitor che potrebbe utilizzare la stessa nostra strategia.
Segnaliamo una guida di Faye Watt presentata a BrightonSEO proprio sulla migrazione di siti web disponibile per il download qui.
Conclusioni
I backlink sono la linfa vitale del web che è un sistema aperto e dinamico. Pagine web sono modificate di continuo e possono essere cancellate senza preavviso. Questo succede in maniera incontrollata tanto più quanto è più grande l’organizzazione che gestisce il sito web.
Il monitoraggio dei link rotti per risolvere gli errori 404 è un attività che deve rientrare nei SEO Audit. In particolare si dovrebbe monitorare:
- la presenza di link rotti;
- traffico verso pagine di prodotti per siti eCommerce;
- Garantire continuità di navigazione all’utente con pagine 404 ben configurate e ottimizzate.
Per siti eCommerce strategie per risolvere un errore 404 possono spingersi oltre quanto già detto. Si possono implementare strategie per la vendita di prodotti sostitutivi di quelli fuori catalogo. E qui puoi inventarti qualsiasi cosa. Vedi ad esempio cos’è che ha fatto la CANON con il suo museo delle fotocamere.
Invia i tuoi suggerimenti per la nostra guida
Manda il tuo contributo su come risolvere un errore 404 e trasformare link rotti in opportunità di link building. Contattaci e invia i tuoi suggerimenti per migliorare questa guida.
- Guida Pratica all’Uso di Bluesky per i SEO - December 2, 2024
- 25 October 2024 – Majestic Compie 20 Anni! - October 31, 2024
- L’uso del Disavow nel 2024 - September 24, 2024