Cet article propose une explication technique à propos du Topical Trust Flow, son calcul et comment éviter de mal interpréter les données. L’article va plus en détail que les articles et vidéos précédentes. À la fin du post, je ferai référence à certaines interprétations plus basiques du Topical Trust Flow et comment l’utiliser quotidiennement.Au dessus se trouve un graphique que j’utilise souvent mais peu en ligne. Majestic utilise un processus itératif pour analyser les liens et collecter nos métriques. Si une page A pointe vers une page B qui pointe vers une page C qui pointe vers une page D, alors une partie de l’influence de la page A influencera le score de la page D. Majestic ne montre que les liens externes (provenant d’autres sites) dans la donnée de lien en ligne mais la plupart des personnes ne savent pas que Majestic utilise également les liens internes pour aider à calculer les scores de Flow Metric (pour faciliter également la découverte de lien). Majestic ne peut garder chaque lien interne que nous

crawlons car notre centre de données aurait besoin de 800% de capacité de stockage supplémentaire. Ce serait insensé car vous pouvez utiliser Screaming Frog ou URLprofiler pour découvrir les liens internes d’un site. Par conséquent, entre le crawl et l’index construit, les données de lien interne sont abandonnées après le calcul effectué.

En se penchant sur l’image au-dessus, le processus itératif est important car sans lui, un moteur de recherche pourrait considérer la page en orange comme ayant un score similaire à la page en vert. Si vous regardez l’image dans son ensemble, il est clair que ce n’est pas le cas car deux des liens de la page en orange proviennent de pages orphelines. Visualisez le graphique de lien comme vous le voyez dans l’image, défini par un trillion d’URLs (et bien plus) et vous aurez une image de ce que Majestic s’efforce de cartographier.

Interpréter les métriques de haut niveau (Trust Flow et Citation Flow)

Avant d’examiner les métriques de Topical Flow, il est logique d’expliquer en premier lieu la différence entre Citation Flow et Trust Flow. Le Citation Flow affiche un nombre brut pour chaque URL connue, basé sur le nombre de domaines référents à chaque URL. Nous itérons ensuite le calcul. Majestic ne l’expliquera pas entièrement mais si une page a deux liens vers l’extérieur, une partie de la valeur passe à travers le lien A et l’autre à travers le lien B. Ce n’est pas le fonctionnement exact, mais ce schéma explique le principe de manière simple et juste. Un score numérique est donc donné pour chaque page de l’Internet, qui est ensuite transformé en une métrique entre 0 et 100. Ce n’est pas une ligne plate, car si cela l’était, presque toutes les pages à 99 seraient du spam pur. Il est possible de visualiser le concept avec des Lego :

Imaginez que chaque bloc de lego 1×1 représente un site. Imaginez ensuite que la pyramide au dessus représente l’univers entier de pages. Celles en haut ont le plus haut Citation Flow (entre 90 et 100) et celles en bas ont un Citation Flow bien plus bas (de 0 à 10). Le diagramme ne sert qu’à illustrer avant que quelqu’un ne mentionne qu’il n’y a pas suffisamment d’étages… Vous avez donc 4 pages en haut de la pyramide et 32X32=1024 en bas de la pyramide !

Il est dur d’arriver en haut.

Le calcul est le même pour le Trust Flow que le Citation Flow mais nous partons simplement des domaines que nous savons avoir été créés et ramenés par des humains. Je n’irai pas dans les détails sur la sélection initiale de ces sites mais il en existe des centaines de milliers et ils ont été examinés par des pairs. Dans le diagramme en haut de la page, vous pouvez vous référer à ceux en bleu.

Mathématiquement, dans le monde “commun” du link building, le Trust Flow et le Citation Flow devraient commencer à converger à l’échelle. La vérité est que ce n’est pas toujours le cas car de nombreux liens sont créés par des machines. C’est pourquoi une augmentation du Citation Flow sans être accompagné par une croissance du Trust Flow peut agiter un drapeau rouge en matière de qualité de lien.

Interpréter les métriques de Topical Trust Flow

Passons maintenant à la méthodologie plus détaillée du “Topical Trust Flow”. Si vous retournez au graphique au dessus, vous pouvez maintenant considérer que si les pages en bleu traitent de “tennis” alors la page verte est bien plus susceptible de parler de tennis que la page en orange. Parce que Majestic peut identifier certaines pages de confiance à propos de tennis, l’algorithme peut utiliser les mathématiques similaires à l’algorithme de Trust Flow pour propager l’information sur l’influence d’une page en matière de tennis au travers de liens.

Une fois encore, chaque page reçoit un score sur son influence relative au tennis qui est ensuite converti en un score compris entre 0 et 100 pour aider les humains à interpréter la donnée.

Passons maintenant à certaines questions. Cet article a vue le jour grâce à un ticket de support émis par Andreas de Cuponation.com qui nous a demandé : les chiffres peuvent-ils être ajouté ensemble d’une façon ou d’une autre pour créer un chiffre commun ? La réponse est non. Pour comprendre pourquoi, nous devrions retourner au Lego. Cette fois-ci, comparons les différents sujets de la pyramide

 

Les pages à propos d’ordinateurs

 

Les pages à propos de tennis

Il y a moins de pages à propos de tennis que pour les ordinateurs. Les scores de 0 à 100 utilisent donc des volumes dans le coeur de l’algorithme extrêmement différents. Vous pouvez seulement interpréter les chiffres relatifs au tennis avec d’autres pages traitant de tennis. Pour vous aider à comprendre, nous utilisons le cercle autour du score de Trust Flow sur le Site Explorer pour approximer le pourcentage de confiance lié à chaque catégorie. Un site comme eBay, qui a de l’influence dans bien des catégories, ressemble à un arc-en-ciel alors qu’un site comme Moz.com obtient quasi exclusivement son influence de Computers / Internet / Web Design and Development (le SEO rentre dans cette catégorie car il n’existe pas de catégorie pour le SEO pour le moment). Si vous passez la souris sur le cercle autour du score de Trust Flow sur la gauche, vous verrez le 91,21% apparaître :

Les scores de Topical Trust Flow ne sont pas des pourcentages ! Moz.com a un Trust Flow haut de 65. Presque tout ce Trust Flow est issu de l’influence de la catégorie Web Design and Development, un sous-ensemble de la catégorie Internet, elle-même sous-ensemble de Computers. Le fait que le Topical Trust Flow pour cette catégorie soit de 64 (en étant proche de 65) est simplement indirect. Mathématiquement, vous auriez besoin de démêler les calculs pour trouver une contribution en pourcentage au Trust Flow global. C’est ce que Majestic a approximé dans la zone en “survol” au dessus de la métrique principale de Trust Flow.

Cliquez sur le graphique pour voir les Topics interactifs (Données illustratives pour les profils Twitter simplement)

Andreas a également demandé dans le même ticket :  “Vous avez un KPI nommé “SourceTopical_TrustFlow_Topic”, ex. “reference/education” ou “shopping/reference”. Qu’est-ce que chacune des catégories possibles veut réellement dire et comment les avez-vous définies ?” Il a trouvé ces références dans le fichier d’export que Majestic rend disponible. Le mot “source” représente le point de départ du lien. Un lien a bien évidemment besoin de deux URLs, un point de départ et d’arrivée. Le Topical_TrustFlow-Topic est l’un des 800 sujets sur lesquels nous effectuons des calculs. Parce qu’il en existe un certain nombre, nous les hiérarchisons. “Reference/education” fait référence à une catégorie de premier niveau pour Reference et une catégorie plus basse pour education. C’est loin d’être parfait mais c’est mieux que de ne pas essayer de catégoriser les sites et cela nous aidera à améliorer notre propre moteur de recherche.

Bien que nous ne listons pas publiquement la liste complète des sujets, vous pouvez voir une grande partie de la liste sous forme de graphique réalisé par l’un de nos stagiaires il y a quelques années (intégrée au-dessus).

Le graphique interactif montre réellement combien de “blocs lego” peuvent encore être impliqués dans le calcul du score de Topical Trust Flow comparé à un autre.

Un vrai casse-tête à comprendre

J’espère que ces explications vous ont aidé à comprendre certains des mystères entourant le Topical Trust Flow en particulier mais également les deux métriques du Trust Flow et Citation Flow. Mais il existe une zone du Site Explorer où j’ai moi-même du mal à interpréter les données. Elle me prend la tête et délivre des tickets de support difficiles. Si quelqu’un trouve une meilleure façon de l’expliquer, je l’invite à suggérer un texte dans les commentaires. Le casse-tête se situe dans l’onglet Topics du Site Explorer. Voici un exemple :

Gauche: Onglet Topics pour la NASA. Encart: onglet Summary pour la NASA

Il peut être très difficile de saisir pourquoi le Topical Trust Flow le plus haut de la NSA dans l’onglet Topics est Science / Astronomy avec un score de 78. Mais dans l’onglet Summary (encart), c’est seulement le DEUXIÈME sujet le plus fort avec un score de 85 derrière Science / Technology à 91. C’est assez perturbant. Pourquoi cela arrive t-il ? Il existe plusieurs facteurs dans cette situation, basés autour de la compréhension qu’il s’agit d’une comparaison de pommes et d’orange. Le score de l’encart (85) représente la force du site de la NSA sur le sujet des Science / Astronomy. L’onglet Topics (78) montre la force cumulée des pages web LIANT VERS LA NASA sur le sujet Science / Astronomy. Parce que la NASA a plus d’autorité que la plupart des sites y pointant, le contenu sur son propre site, et la manière dont les liens internes propagent l’information de son propre site peuvent significativement changer les scores. Cet effet est une addition au problème de taille de brique de Lego.

Une façon d’interpréter ce phénomène est de comprendre que les liens ont une URL de départ et une URL de destination. Si une page à propos de tennis pointe vers une page traitant d’astronomie, cela ne réduit pas l’influence de la page ciblée en astronomie mais augmente le Trust Flow global de la page. C’est donc une page plus forte, et n’importe quel lien sortant n’aura pas le même contexte ou valeur qu’un lien entrant.

Époustouflé ? Vous pouvez maintenant considérer les trois colonnes sur la droite. Pourquoi la colonne 1 indique 2.4 millions, la deuxième colonne 27.7 millions et la dernière montre 14500 ? C’est parce qu’il y a 2.4 millions de pages pointant vers la NASA qui en elle-même ont du Topical Trust Flow comprenant la catégorie Astronomy. Cependant, si vous regardez au niveau du domaine, il y a 27 millions de domaines qui pointent vers la NASA ayant un peu de Trust Flow Astronomy. Quand est-il de la colonne 3 ? C’est une sous-catégorie de la colonne 1 et c’est le nombre de domaines qui ont donné les scores de la colonne 1.

A retenir

  • Les Flow metrics ne parlent pas de “visibilité de positionnement” ou même “de comptabilisation de liens” d’une page. Ils sont bien plus fondamentaux et résultent d’un algorithme itératif.
  • Les Topical Flow Metrics aident à identifier l’influence de pages ou de sites pour un sujet. Une page peut être influente à propos de différents sujets mais le score de 0 à 100 compare les autres pages ou sites entre eux sur ce sujet. Ils ne comparent pas directement les scores pour d’autres sujets sur la même page.
  • Je suis sûr que vous serez d’accord, les mathématiques sont compliqués. Actuellement, les scores mettent 24 heures à être calculés. Nous pouvons vous apporter de la donnée brute plus rapidement mais nos clients paient pour des perceptions.
  • Le Topical Trust Flow d’un lien est une fausse appellation. C’est les URLs (ou les sites) qui ont des Flow Metrics. Un lien doit donc connecter deux points différents avec deux sets différents de Flow Metrics.

A retenir bis

Cette visualisation en brique Lego des flow metrics aide à comprendre une autre confusion relative à la comparaison impossible des Flow Metrics de sous-domaine avec un domaine racine ou un score de Flow Metric au niveau de la page. Les blocs de construction sont entièrement différents. Il existe une critique fréquente concernant Majestic et le fait que l’outil montre de nombreuses variations de Flow Metrics. Mais elles sont toutes valides et utiles tant que vous comparez toujours des pommes avec des pommes.

Si vous préférez entendre certains de nos ambassadeurs de marque parler des Flow Metrics, vous pouvez jeter un oeil à nos vidéos liées plus bas.

Comment utiliser et comprendre le Topical Trust Flow

Comment comprendre et utiliser les Flow Metrics

Le link Building avec le Topical Trust Flow

Save

Save

Save

Save

Save