Homepage Variants redirect map

È disponibile a tutti gli utenti una nuova visualizzazione in Site Explorer che documenta la configurazione di redirect. Una pagina può avere quattro diverse opzioni di accesso che sono:

  • www
  • senza www
  • http e/o https

Questi dati sono disponibili per l’indice recente e consultabili a questo link.

I siti web sono realizzati utilizzando diverse tecnologie e moltissime piattaforme di sviluppo – ognuna con un approccio diverso. Sembrano lontani anni luce i tempi pionieristici del web quando i primi webmaster creavano siti in HTML puro, seguendo le prime specifiche di Sir Tim Berners Lee. Il web sicuro, noto come HTTPS, ha facilitato l’uso delle transazioni sicure su cui è stato costruito il web commerciale. Lo sviluppo della crittografia ha favorito una diminuzione dei costi, rendendola accessibile anche ai siti web di piccole e piccolissime iniziative imprenditoriali. L’HTTPS è diventato uno strumento utilizzato non solo sulle pagine di login e di pagamento, ma anche su tutte le pagine del sito.

Inoltre l’alias “www” utilizzato per significare “World Wide Web” non sempre trova uso e anzi ha perso il suo appeal degli anni ’90 e primi anni 2000. Infatti, si incontrano sempre più spesso siti che non utilizzano il prefisso WWW.

Per questi motivi ci troviamo spesso davanti a siti web che, in linea di principio, possono avere quattro variazioni di nome a cui corrisponde la stessa pagina web:

  • https://www
  • https:// (senza WWW)
  • http://www.
  • http:// (senza WWW)

La gestione di queste quattro varianti è molto dibattuta tra i SEO perché possono esserci delle conseguenze sulle performance del sito. È procedura standard scegliere una delle quattro opzioni come quella di riferimento e implementare dei redirect delle altre tre varianti.

Ma quale di queste è in uso sui siti dei tuoi clienti?

È attiva più di una opzione?

Homepage Variants (visualizzazione delle varianti della Home Page) serve a scoprire proprio questo. Forse hai implementato l’HTTPS ma, per la fretta, hai dimenticato di “sistemare” le altre tre opzioni e quindi sono ancora attive. Le varianti attive sono riconosciute e riportate da questa visualizzazione in Site Explorer.

Site Explorer già mette a disposizione dati di spidering per tutte queste varianti. Così abbiamo pensato di fornire un dato aggregato utile, ad esempio, per lo sviluppo di un Audit SEO o analisi di un sito web in fase di preventivazione di attività di ottimizzazione.

Creare questo report è semplice: basta accedere ai dati con Site Explorer e scrollare la pagina per arrivare alla sezione Homepage Variants. Qui si trova la tabella con i dati di ciascuna variante, i domini esterni e il numero di backlink.

Varianti della Home Page di Mozlla.org
Tabella dei dati delle varianti di home page di mozilla.org

Pur essendo molto chiara, una tabella di dati non è facilmente fruibile. Per questo abbiamo aggiunto una mappatura grafica dei redirect, connessioni, timeout ed errori del sito.

La mappatura delle varianti che mostra le varianti che puntano a mozilla.org/en-us

Come si verifica un dominio?

Le varianti di un sito web si possono controllare con Site Explorer facendo una ricerca con l’indice recente per dominio o URL. Il nuovo pannello Homepage Redirects è posizionato sotto la sezione Outbuond Links.

Screensho presa da Site Explorer dove si vede il pannello delle variazioni Homepage Variants.

Questo pannello non è disponibile per le varianti “non-homepage”, sottodomini o per ricerche effettuate con l’indice storico.

Alcuni esempi

l modo migliore per capire l’utilizzo di questo dato è presentare alcuni esempi pratici.

Queste sono le varianti Homepage di majestic.com. Utilizziamo come Home Page del sito https:// (senza www). Le tre alternative hanno tutte reindirizzamenti permanenti alla pagina predefinita.

In questo esempio ciascuna variante del nostro nome a dominio precedente, majesticseo.com, ha un reindirizzamento permanente 301 off-site verso majestic.com

Alcuni esempi non standard

Se tutt’i reindirizzamenti fossero configurati a regola d’arte, questo tool sarebbe inutile.

In pratica, si vede come le configurazioni non sono sempre precise e si possono scoprire delle cose interessanti.

Nota: Per mantenere l’anonimato abbiamo omesso, ove possibile, il nome dei siti dalle immagini che seguono.

Per questo sito http:// e http://www sono entrambi reindirizzati alle rispettive versioni in HTTPS. Il nostro crawler ha verificato e riportato i reindirizzamenti dell’immagine che segue:

L’esempio che segue è di un sito che ha varianti https:// e http:// (senza www) che reindirizzano il nostro crawler verso un altro dominio. Tuttavia non è stato possibile indicizzare nessuna delle due versioni //www. In questo caso il problema deriva da una direttiva nel robots.txt che i nostri crawler hanno rispettato.

Quest’altro sito ha un a combinazione di reindirizzamenti temporanei e permanenti alla versione https://. Gli indirizzamenti temporanei (302) sono identificati da una linea tratteggiata.

In questo caso il sito ha tre varianti che puntano alla URL identificata con https://www MA i reindirizzamenti sono temporanei anziché permanenti.

Quello che segue è un caso complesso: una catena di reindirizzamenti con due varianti che puntano a https://www. C’è un ulteriore redirect dell’https://www e http:// che rimandano ad altra pagina: una catena anomala di tre reindirizzamenti con 301 e 302/307.

La mappatura effettuata da Homepage Variants riporta anche problematiche riscontrate durante il crawl delle pagine. Nel prossimo esempio tre reindirizzamenti hanno avuto problemi diversi (“Connect Failure” e “HTTP 504 Gateway Timeout) con un ulteriore 301 verso altro dominio.

Non tutt’i reindirizzamenti sono 301 oppure 302/307. Nel prossimo esempio si utilizza un META Redirect. Da notare la presenza di solo tre varianti. Capita spesso che, per i siti più piccoli, non tutte le varianti sono indicizzate dal nostro crawler.

Ci sono siti come quello della screenshot che segue che propongono soluzioni “creative” come https://www e http://www con reindirizzamento 301 alla pagina https://, mentre utilizzano un canonical che da http:// punta alla destinazione finale https://

Questo è un esempio di loop causato da un redirect. Da http://www che punta a https://www. Però sulla pagina https:// c’è un canonical meta tag che punta di nuovo alla http://www!

(Il punto interrogativo nella prima riga accanto a https:// nell’immagine precedente indica che quella pagina non è stata indicizzata dai nostri crawler.)

Ecco un altro esempio dove un canonical e un 301 si puntano a vicenda:

Infine, ecco l’esempio da noi preferito. Ogni variante è in sequenza, creando una catena ordinata di reindirizzamenti.

Alcune considerazioni conclusive

È difficilissimo recuperare dati così dettagliati per tutto il Web. Ci sono alcune cose che bisogna sapere e che riportiamo per opportuna conoscenza a proposito di questo dataset.

1 – Le quattro varianti potrebbero essere state censite in momenti diversi

Potrebbe sembrare intuitivo e quindi si potrebbe dare per scontato che questi dati sono stati raccolti tutti nello stesso momento. Per siti di piccole e medie dimensioni è molto probabile che le cose non siano andate così e che quei dati sono stati raccolti in momenti diversi.

Le conseguenze sono evidenti nell’immagine che segue. Infatti in questo esempio si vede come l’indicizzazione ha dato come esito “Resolution Failure” (in data 11 e 19 Settembre), ma poi altri due tentativi hanno dato esito positivo.

2 – Si possono verificare degli eventi singolari durante l’indicizzazione

Può succedere che i nostri spider hanno fatto accesso a questa pagina il server ha restituito un errore HTTP 500 Internal Server Error. Si tratta di un evento singolare che non si è verificato ancora quando abbiamo indicizzato la variante https://.

Infine, dal momento che le nostre risorse di crawling sono geograficamente distribuite, potremmo ricevere dei redirect localizzati che possono cambiare in funzione dell’indice. In questo esempio, Nike ha diretto una istanza di crawling al loro sito GB e una istanza successiva alla versione canadese del sito.

3 – Non abbiamo indicizzato tutte le varianti di ogni dominio negli ultimi 120 giorni

Ci sono dei casi in cui i crawler non hanno fatto spidering negli ultimi 120 giorni (la finestra temporale a cui si accede con l’indice recente).

L’ultimo esempio di quest’articolo è un sito molto piccolo ma non sono stati visitati negli ultimi 120 giorni.

Ricorda che è possibile richiedere l’indicizzazione di URL in qualsiasi momento.

Concludendo

Homepage Variants è disponibile a tutti gli abbonati di Majestic. Scopri tutte le funzionalità di Majestic collegandoti al nostro sito dov’è disponibile la Demo Gratuita della settimana.

Homepage Variants è molto utile per individuare possibili errori di reindirizzamento che possono creare confusione e interferire con una corretta indicizzazione nei motori di ricerca.

Il nostro team dedicato al supporto tecnico è a disposizione per fornire informazioni e raccogliere feedback sull’uso di questo e gli altri strumenti di Majestic.