Combien de textes d’ancrages sont partagés par les sites web ?
Certaines phrases sont-elles associées à différents secteurs de marché ?
L’un des avantages de travailler au sein de l’équipe de développement chez Majestic est que lorsqu’une question se pose sur certains aspects d’Internet, le plus souvent, la réponse est à portée de main. Nous sommes en mesure d’obtenir toutes les informations nécessaires en passant quelques appels à l’API et à l’aide de plusieurs lignes de code – et grâce à des outils tels que wordle, d’excellentes représentations sont souvent accessibles en un clic.
Dans l’objectif d’étudier les relations entre le texte d’ancrage de sites dans le même secteur de marché, j’ai écrit une petite partie de code pour programmer la commande API Majestic API “ObtenirTexteAncrage” à récupérer les 250 principales phrases d’ancrage utilisées par plusieurs différents sites web. Les données de sortie des appels “ObtenirTexteAncrage” ont ensuite été traitées pour identifier le texte d’ancrage commun à plusieurs sites, avant d’utiliser la fonction d’importation de données avancée de Wordle pour produire une représentation de données.
J’ai commencé par étudier le texte d’ancrage propre à quatre sites web populaires : blogger.com, tumblr.com, wordpress.org etlivejournal.com.
Wordle de texte d’ancrage utilisé sur des blogs
Le résultat est surprenant – mais également assez ennuyeux – “Lire plus sur mon blog ici” ? (Et qui est Sarah ?)
je soupçonne que du fait de l’immense diversité de contenu présent sur ces blogs, la diversité du texte d’ancrage résultant rend assez improbable le fait de trouver un grand nombre de phrases correspondantes parmi les 250 principales associations inhérentes à chaque site.
Je me suis ensuite intéressé à un élément plus spécialisé – les sites web des constructeurs automobiles allemand Audi, BMW, Mercedes Benz, etVolkswagen.
Wordle de texte d’ancrage utilisé sur les sites des constructeurs automobiles allemands.
Au cas où vous vous posez la question, “probefahrt vereinbaren” signifie “organiser un essai sur route” (d’après Google translate). J’étais assez satisfait lorsqu’un collègue a deviné “Constructeurs automobiles allemands” d’après le wordle correspondant.
Débordant d’enthousiasme, j’ai décidé de tenter l’expérience sur deux sites d’actualités issus de deux marchés différents – les États-Unis et le Royaume-Uni. Pour les États-Unis, nous avons The Wall Street Journal, the New York Times, Huffington Post etthe Washington Post. Pour le Royaume-Uni, nous avons the Guardian, the Telegraph, the Times, et the Independent:
Wordle de texte d’ancrage utilisé sur les sites de certains sites d’actualités.
Wordle de texte d’ancrage utilisé sur les sites de journaux populaires au Royaume-Uni.
J’ai trouvé intéressant le fait qu’il semble que dans l’industrie de la presse écrite, de part et d’autre, différentes publications semblent être liées au texte d’ancrage d’un concurrent – malgré que cela soit certainement du à la pondération de l’algorithme et aux seuils utilisés pour produire le wordle – le décompte des domaines de référence relatifs à une phrase dotée d’un seuil égal à zéro signifie que si 60 000 sites web sont reliés au site du Guardian avec la phrase “the guardian” et qu’un site est accidentellement relié à celui du Telegraph avec le même texte d’ancrage, alors le Guardian se classe en bonne position
Alors j’ai pensé, et si on augmentait la liste des sites de manière à obtenir quelque chose de plus fiable que deux associations de quatre sites web – disons 4 associations issues de l’ensemble des sites d’actualité indiqués ci-dessus ? Voyons le résultat :
Wordle de texte d’ancrage utilisé sur les sites d’actualités britanniques et américains
Le fait d’avoir augmenté la liste et les seuils semble avoir réellement contribué à créer une “empreinte” actualités pour le texte d’ancrage. Ce processus suggère également que “ici” est beaucoup plus omniprésent que “Cliquez ici” – au moins pour le l’échantillon de données indiqué ci-dessus – peut-être s’agit-il du résultat d’une lecture trop littérale d’une Recommandation W3C?
- Aborder la prise en charge du « suffixe public » - August 22, 2017
- Plateformes de Texte d’Ancrage - May 13, 2015