Réparer des liens cassés ou supprimés a beaucoup d’avantage. Si votre lien venait d’une source respectée, hautement qualitative, vous ne voudriez pas le récupérer ?

Parfois un lien est enlevé ou supprimé. Peut-être de façon intentionnée ou simplement par erreur. Avec le Site Explorer de Majestic, nous pouvons vous aider à exactement identifier la raison derrière la perte d’un lien, rendant cela plus facile à récupérer, si c’est une bonne source.

Avec un onglet entièrement dédié à la compréhension de ces liens, vous pouvez cliquer et glisser les parties du graphiques qui retiennent votre attention et jeter un coup d’oeil aux liens perdus sur ces rendez-vous spécifiques. Plusieurs raisons différentes se présenteront comme des problèmes techniques, des réponses HTTP, parfois ce sera du à la nature du type de site.

Dans cet article, nous couvrirons (en partie) les raisons que vous rencontrerez en analysant vos liens perdus au sein de Majestic:

Liens retirés

C’est la raison la plus commune pour la perte d’un lien. Il a simplement été retiré par le webmaster. Qui aurait pu le deviner !! Cependant, pour rendre les choses compliquées, ce n’est pas toujours le cas. Dans certains cas c’est le type de site sur lequel votre lien a été trouvé. Au moment où vous nous lisez, tout le monde est a la recherche de contenu frais. Les flux RSS trouvent par exemple constamment de nouveaux contenus à reposter dans leurs flux. Par conséquent, votre lien n’est pas statique et il progressera dans le flux en se détachant peut-être même complètement de la page. Si cela arrive lorsque notre robot revisite l’URL originale, votre lien ne sera pas trouvé. Votre lien est maintenant sur une nouvelle URL et nos robots afficheront un lien manquant.

Malheureusement, il est difficile pour n’importe quel robot de connaître la différence entre un lien ‘poussé’ et un lien ‘enlevé’. Mon conseil serait de rechercher des indices. Pouvez-vous voir le mot ‘feed’ dans l’URL ? Si oui, je peux presque garantir que le lien est simplement sur la page suivante. Dans le pire scénario, vous devrez utiliser le raccourci ‘icône engrenage’ pour visiter le lien directement et voir par vous même. Vous pourriez aussi vérifier vos nouveaux liens (New links dans l’application) pour voir si vous avez récemment reçu un lien du même domaine.

La publicité peut parfois affecter vos liens également. Si vous avez démarré une nouvelle campagne qui inclut le placement de publicités sur un réseau publicitaire, nous pourrions voir un jour votre publicité pour une page en particulier mais le jour suivant une nouvelle publicité pour une entreprise différente.

Une fois de plus, la donnée suggérera que le lien a été ôté. Heureusement, dans ces cas là le lien est souvent une image alors vérifiez avant de trop vous inquiéter !

Canonique de redirection

Les balises canoniques n’ont rien de nouveau. Ces types de balise vous permettent de diriger les moteurs de recherche vers la page que vous souhaitez qu’ils crawlent et non ses duplicatas. C’est souvent le cas pour les www vs les non www ou l’http vs l’https. Bien sur dans ces cas là vous aurez uniquement besoin de faire indexer qu’une seule page par les crawlers.

Alors pourquoi cela est vu comme un lien perdu ? Et bien, la balise canonique devrait certifier que la page est sur un site différent. Par exemple, pour une page visible sur www.site.com et site.com, Majestic montrera le lien sur ces deux sites. Si après coup, une balise canonique est ajoutée à l’une des pages pour que www.site.com soit la page à prendre en compte, le site.com sera considéré comme une redirection de www.site.com et donc le lien sera perdu sur site.com.

Réponses HTTP:

HTTP 301 – Redirection Permanente

Cette redirection est utilisée lorsque vous souhaitez déplacer une page entière vers un nouvel emplacement, pour toujours. Ce type de redirection fait passer le jus de lien aux yeux des moteurs de recherche, plus que d’autres options de redirection. Voir cela dans votre onglet Lost signifiera certainement que vous avez un nouveau couple de lien issu de ce changement sur une nouvelle URL. Cela peut nous prendre quelques jours de générer la nouvelle source de la page et de l’ajouter à votre profile.

HTTP 302/ 307 – Redirection Temporaire

Les webmasters peuvent installer cette redirection pendant que le site est en maintenance, en refonte ou s’il y a un petit problème. Ce type de redirection passe un tout petit peu de jus de lien car elle est censée être temporaire. Si vous relevez cette redirection au sein de vos liens perdus, il est probable que le lien sera bientôt de retour.

HTTP 403 – Interdit

Cette redirection indique habituellement que nous avons réussi à atteindre une URL en particulier, qu’elles ont répondu mais qu’elles nous bloquent l’accès. La plupart du temps, c’est du à des problèmes provenant de votre serveur ou fournisseur d’accès. Cela peut être du à des logiciels de sécurité ou que la configuration par défaut n’autorise pas nos robots à passer. Pour résoudre ce problème, envoyez simplement un mail à votre hébergeur et demandez lui de mettre sur liste blanche les robots que vous souhaitez. Il est difficile de savoir quels autres robots sont bloqués mais une chose est sûre, ils n’autorisent pas notre robot MJ12 à passer. A moins que vous ne connaissiez le webmaster de la source et que vous puissiez alors le contacter et lui demander de retirer ce bloc.

HTTP 404 – Page non trouvée

De façon simple, la page a été supprimée. Cela n’a rien de personnel envers votre entreprise ou votre lien, le webmaster a simplement décidé de retirer le contenu. Si vous notifiez cela dans vos liens perdus, vous pouvez avoir envie d’essayer d’avoir un lien d’une page différente depuis le même domaine. Juste parce que la page est partie ne veut pas dire que la relation que vous avez avec le site a à en souffrir. De plus, certains vous diront que c’est une acquisition facile.

HTTP 406 – Non Acceptable

Similaire à l’HTTP 403, la réponse 406 d’un autre côté est envoyée lorsque le serveur ne peut terminer la requête faite. Actuellement notre robot n’est pas capable de faire quelque chose lorsqu’il s’agit d’images ou de films et donc de réduire la bande passante et le temps de chargement que nous incluons avec nos requêtes afin de n’envoyer une réponse que si le contenu est du texte/html/xml. Si le serveur ne croit pas que c’est le cas alors il devrait envoyer une réponse 406. Cela peut être du soit parce que nous demandons une image ou d’autre contenu non acceptés soit parce que les types mimés dans votre serveur sont incorrectement configurés.

HTTP 500 – Erreur interne du serveur

Voir cette erreur signifie que notre robot a rencontré un problème inattendu en essayant d’atteindre une page ou un domaine. Cette réponse du serveur web ne spécifie pas réellement ce qu’est le problème, ce qui rend les choses plus dures à résoudre.  Les opérateurs auront besoin de localiser les logs et de les analyser pou résoudre le problème. Utiliser un site comme http://downforeveryoneorjustme.com/ vous aidera à savoir si le problème a été réglé. Si c’est le cas, réenvoyez nous le lien en utilisant l’ URL Submitter.

Problèmes techniques

Arrêt (Timeout)

Cela arrive lorsque l’URL demandée prend trop de temps à répondre à la demande de notre robot. De façon assez simple, si une page ou un domaine charge pendant trop longtemps, il y a certainement un problème technique.

Échec de connexion

Similaire au précédent, cette réponse signifie qu’il y a une problème technique. Cet échec indique des problèmes d’infrastructure particuliers entre le serveur et le site web.

Échec de résolution du nom de domaine

Cela montre qu’il y a un problème avec le serveur DNS du domaine source souvent du à un changement d’adresse IP. Après avoir effectué le changement, cela prendra un peu de temps aux choses de s’agréger. Une autre raison pourrait simplement être que le serveur DNS est cassé. Si c’est le cas, alors nous ne pouvons pas crawler le site.