¡Hemos lanzado una nueva herramienta! La Flow Metrics History te permite ver cómo el Flow Metric (Trust Flow and Citation Flow) de cualquier dominio ha cambiado a lo largo del tiempo. Este post también habla sobre por qué esta herramienta era necesaria, cuales son sus principales usos y por qué algunos sitios son más propensos al cambio que otros. Si profundizas en este post, conocerás mucho más sobre las métricas de Majestic. Si simplemente quieres saber QUÉ hemos lanzado, pero no el POR QUÉ, los dos primeros pantallazos te explicarán lo más básico al instante.

Novedad: La herramienta Flow Metrics History

Los usuarios Gold y Pro (y superiores) ahora pueden usar la nueva herramienta Flow Metrics History, como puede verse en la imagen de arriba. (Los usuarios Lite y Silver aún pueden configurar campañas y obtener este dato a través del tiempo)

La herramienta se ve igual que el resto de las herramientas de comparativas de la web, pero muestra todos los datos de una manera diferente. La herramienta otorga a los usuarios ¡18 meses de histórico por cada web! ¿impresionante verdad?

Para usarla, simplemente introduce uno o más dominios en el cuadro de búsqueda de la herramienta… hasta diez… y podrás ver algunos bonitos gráficos. El que está arriba a la izquierda muestra un gráfico que es muy similar al de la pantalla de Campañas. A la derecha verás dos gráficos temporales. El que está colocado más arriba muestra el Trust Flow a lo largo del tiempo y el de debajo muestra el Citation Flow. He seleccionado unas cuantos webs que tratan temas del Espacio en mis ejemplos:

El principal propósito de la herramienta

Algunos sitios son más propicios a mayores niveles de fluctuación de Trust Flow que otros. Algunas de las razones están resaltadas más adelante en este post, pero el mero hecho que esto ocurra significa que conocer la “Moda” (valor más común) de la puntuación de Trust Flow a lo largo del tiempo es más confiable que saber la puntuación actual de Trust Flow o Citation Flow de algunos sitios. NOTA: Moda, en estadística, es el valor que con mayor frecuencia se repite en una serie de datos.

Estos gráficos dejan muy claro los valores “modales” de Trust Flow y Citation Flow para un sitio web y esto ayuda a tener mejor información para la toma de decisiones de Domainers y Linkuilders.

En general, tiene más sentido considerar la moda como la fortaleza subyacente de un dominio. Al mismo tiempo, el hecho de que algunos sitios fluctúen más que otros nos muestra un interesante acertijo. Conociendo por qué pasa esto podemos mejorar el conocimiento que tengamos de un dominio.

¿Por qué el Trust Flow a veces fluctúa?

¿Ves en la imagen de arriba qué los picos de Trust Flow caen estrepitosamente en hawking.org.uk, y space.com y algún otro más? ¿Por qué ocurre esto?

Esta pregunta reside en el corazón de por qué Majestic construyó esta herramienta. Hace unas pocas semanas, Majestic empezó a escuchar comentarios sobre que la métrica Trust Flow de la gente estaba fluctuando. Clientes y usuarios gratuitos comenzaron a sugerir que habíamos cambiado nuestro algoritmo.

¡Pero sencillamente este no era el caso! Nuestro algoritmo era exactamente el mismo.

De manera gradual, a lo largo del tiempo, más gente estaba diciendo que estaban viendo webs con una fluctuación en el Trust Flow. Los sitios que he usado en este post reflejan qué está pasando a nivel mundial.

Space.com parece que fluctúa, pero Nasa.gov (el cual es más fuerte) y space-facts.com (el cual es más débil) ambos permanecen fuertes desde el comienzo de la medición hasta el final.

Existen un montón de posibles razones de por qué esto puede estar pasando, pero detrás de todo esto está el hecho de que nos ha ayudo a entender que el índice de Majestic es una “fotografía en el tiempo”. A diferencia de la mayoría de otros índices de links, Majestic tratar de establecer la importancia de otras página (de forma global, también cualquier sitio web al completo) y cómo cada web es valorada, basándose en su relación con otras páginas web en el universo conocido de sitios de internet.

Aparte: Decir que el índice de Majestic es diferente a otros índices requiere una aclaración. Es MÁS parecido a cómo funciona Google en sí mismo, ya que Google todavía utiliza el Page Rank a día de hoy (cómo confirmó Gary Ilyes en Twitter) y todos los cálculos matemáticos que hay detrás del Page Rank están esencialmente basadas en una matriz de toda la web. Así es el índice de Majestic. Cada vez que el índice es calculado, Majestic hace un nuevo índice en vivo. Esto ocurre en torno a cada 24-30 horas y entonces el algoritmo automáticamente empieza a trabajar de nuevo. Es entonces cuando tomamos una nueva fotografía de qué vemos de cada página y empezamos a hacer los cálculos. 24 – 30 horas después sacamos otro nuevo índice y el proceso se repite.

Pequeños cambios en lo que el algoritmo de Majestic ve pueden tener potenciales y dramáticas implicaciones. Incluso que tu sitio sea accesible o no puede ser suficiente… estamos viendo ejemplos de sitios fluctuando donde podemos ver claramente lo que ocurre. El problema es más complejo que todo eso.

Construir un nuevo índice por completo cada día es, con bastante diferencia, la principal razón por la que Majestic está empezando a ver fluctuaciones. Si en una de esas ocasiones el bot no puede ver una simple página o sitio web, una pregunta que requiere análisis es si esto podría afectar dramáticamente a otros muchos sitios web al mismo tiempo.

Majestic necesita responder a esto para hacer que las Flow Metrics (Trust y Citation Flow) sean más estables. Los clientes se beneficiarán de esta herramienta porque les permitirá ver más allá de estas fluctuaciones. No todas las fluctuaciones serán el resultado de “falsos positivos”. Algunas serán un signo de un comportamiento que se catalogue como una bandera roja, un signo de atención al que vigilar. Por ejemplo…bloquear el bot de Majestic (MJ12Bot) es una bandera roja.

¿Puede el bloqueo del bot MJ12Bot causar valores erráticos de Trust Flow?

Algunas redes de enlaces bloquean MJ12Bot para intentar esconder los enlaces externos que apuntan a otras webs. La idea es que la PBN (red privada de enlaces) obtiene un Trust Flow alto, porque Majestic ve los enlaces AL sitio. Esto significa que pueden vender enlaces desde el sitio, pero MJ12Bot no puede ver los enlaces DESDE el sitio hacia afuera, aunque Google sí puede, por tanto la idea es que la red de enlaces permanece oculta a ojos curiosos. La bandera roja es que MJ12Bot es, en primer lugar, bloqueado; pero independientemente del método, la idea es que esto pueda dar una imagen errónea del sitio porque Majestic es incapaz de dar a la web la estabilidad que muchos sitios obtienen del enlazado INTERNO. He aquí la explicación visual de esta teoría:

El efecto de este patrón de comportamiento gira en torno a que si una página grande no puede ser rastreada un día, entonces la caída de Flow Metrics puede parecer desastrosa para la web que bloquee MJ12Bot. Las malas noticias son que esta página puede no estar vinculada directamente al sitio, que solo sean unos pocos enlaces en la cadena de links. Las buenas noticias son que no ha pasado nada REALMENTE malo. La otra buena noticia es que si no intentamos crawlear (rastrear) esa página del todo en un ciclo, asumimos que será la misma que la última vez que la crawleamos. En otras palabras, tenemos que ver actualmente un error de rastreo de esa URL para que esto suponga un efecto destacado.

¡Todo va sobre la rastreabilidad!

El ejemplo de arriba, aunque factible, realmente no explica todos los escenarios. Lo qué podría explicar el 90% de los problemas, por otro lado, es si habría cada vez más motivos por los que MJ12Bot estuviera recibiendo errores intermitentes de rastreo de páginas (en lugar de ser simplemente bloqueado). Hay innumerables razones de por qué MJ12Bot podría tener Ttimeouts intermitentes cuando crawlea páginas. Esto no es algo propio solamente de Majestic, incluso Google ofrece herramientas dentro de su Search Console para ayudar a reducir los Timeouts y los errores en las páginas de tu web, precisamente porque errores como este pueden también afectar a la comprensión de Google de tu sitio. Google ha tenido más empuje abordando este problema, pero la “vieja escuela” del SEO bien recordarán la manera en que el índice de Google podría fluctuar entre los distintos Google Dance (los cambios en el ranking de Google, en el pasado, ocurrían en fecha muy concretas, conocidas como Google Dances), y en ocasiones esta podría haber sido la razón.

He aquí una posibilidad interesante, referente al setup de Majestic, que sirve de ejemplo. Con el incremento en el uso de páginas HTTPS, un servidor web y tu navegador tienen que comunicarse el uno con el otro para configurar y aceptar el protocolo de seguridad con el cual ambos (el servidor y el navegador) puedan trabajar para transmitir información antes de que la página pueda cargarse. Uno de estos protocolos es el llamado “TLS”. La versión actual es la 1.2 y la recomendación es que los servidores web dejen de aceptar TLS 1.0 e inferiores para acceder al contenido https, por razones de seguridad. Sin embargo, no todos los clientes usan TLS 1.2. ¿Por qué podría afectar esto a Majestic más que a otros crawlers? Porque Majestic usa un crawler distribuido. Esto significa que Majestic en sí mismo no controla la configuración del software del cliente. Podría ser una máquina Windows, un Mac o Linux. Se podría haber mantenido actualizado o tal vez haber estado felizmente rastreando internet durante años en un Wind
ows NT. La mayoría de las veces, MJ12Bot crawleará soportando TLS 1.2 pero a veces podría crawlear desde una máquina no configurada correctamente y es entonces cuando recopilará un Timeout o cualquier otro error.

El resultado podría ser un pico hacia abajo, ¡24 horas después!

Esta es sola una razón por la que un error puede ocurrir, pero pueden haber muchas otras. Algunos de estos errores no son generalmente entendidos o explicados a los SEOs, por ello aquí os dejamos unos cuanto que merece la pena tener en cuenta:

  • Si el enlace se encuentra en una web con hosting en china que está siendo crawleada desde USA, China podría bloquear el crawl si las tensiones son altas a través del firewall chino.
  • El pasado fin de semana tuvimos un problema en Majestic con el 15% de usuarios, cuando el protocolo DNSSEC dio un Timeout, dejando algunos sistemas DNS (incluyendo GoogleDNS) incapaces de establecer completamente la seguridad https. Cómo resultado, los usuarios web que usaron estos servidores DNS no recibieron ninguna información.
  • Los servidores de búsqueda de DNS se actualizan periódicamente. Esta es una de las razones por las cuales cambiar los parámetros de las DNS puede hacer que la propagación de las mismas tarde varios días. Cuando se hace, estas actualizaciones pueden causar errores durante uno, dos días, o incluso peor… la modificación puede estar corrompida, lo cual afectará a muchos usuarios (y bots) hasta la próxima actualización.
  • El servidor podría estar caído cuando lo crawleamos, simplemente reinícialo. Para cuando el reboot haya finalizado, MJ12Bot ya habrá pasado.

¿Cómo el dueño de una web puede usar esto?

Como puedes ver, algunas de las razones son cosas que podrías imaginar, mientras que otras o muchas otras son más difíciles de aislar. Sin embargo, el problema más común, parece ser que Majestic asume que todos los enlaces están muertos en la página cuando encuentra un error leyendo la página.

El dueño de un sitio que esté mirando una web que tenga múltiples picos debería tratar de entender el por qué podría estar pasando esto. Dirígete a tu Google Search Console y echa un vistazo a la sección de errores de rastreo para ver si Google está experimentando problemas similares y Timeouts. Si los hay,  trata estos como una prioridad en tus esfuerzos SEO. Deberían ser temas a solucionar rápìdamente.

Un gran impulsor…Citation Flow

Desafortunadamente, podría ser que la explicación de arriba fuera totalmente posible y finalmente solucionable, pero no es la respuesta completa. En el histórico de ejemplos de Trust Flow mostrado arriba, algunos Trust Flow de webs repuntaban ligeramente mientras que otros no. Así que si esto era toda la explicación, entonces el Citation Flow debería también repuntar…pero ¡mira el Citation Flow!

 

No hay tales picos de fluctuación en la mayoría de los Citation Flows para el mismo listado de webs durante el mismo periodo de tiempo. Si la explicación de arriba fuese todo…que un error leyendo la página ocasionalmente explicara completamente este comportamiento, entonces ¿no debería el Citation Flow fluctuar también? La respuesta intuitiva debería ser “si”, sin embargo, Majestic es mucho más propenso a volver a recrawlear página con un Trust Flow alto que páginas con un Citation Flow alto, porque tratamos el Trust Flow como una señal de valor superior…al menos así era hasta que esta anomalía empezó a aparecer. Además, muchas MUCHAS páginas más en internet tienen Citation Flow que Trust Flow. Esto significa que la gran matriz aludida anteriormente tiene muchos más puntos de datos distintos de cero en el cálculo del Citation Flow.

El Citation Flow puede ser intrinsecamente más elástico que el Trust Flow para dar mensajes de error. De momento, nosotros todavía no lo sabemos seguro. Esto es uno de los motivos de haber construido esta nueva herramienta.

¡Yo solo quiero una métrica estable!

**Actualización – Hemos sacado una implementación y todas las métricas parecen ser estables otra vez**

Te hemos escuchado. Nosotros también queremos una métrica estable. O más concretamente, queremos una verdadera métrica la cual no se vea afectada por falsos positivos. Sin embargo, aún habrá sitios web que fluctúen una vez que hayamos resuelto esto. Los que, por ejemplo, sigan bloqueando nuestro bot, podrían continuar sufriendolo, al igual que los sitios que dependan de enlaces de la primera página de blogs y sitios de noticias que (por su naturaleza) son transitorios. A partir de la creación de la herramienta del histórico de Flow Metric, los usuarios Pro pueden usar la línea de tendencias para continuar estimando el valor de una web. Los usuarios Lite o Silver pueden también hacer esto utilizando la función de Campaña y otros podrían preferir confiar en el Citation Flow o el contador de Referring Domain. Sin embargo, creemos que vamos bien en nuestro camino ahora que hemos vuelto a tener una métrica estable. Esto dejará atrás un legado importante, ¡la herramienta de histórico de Flow Metrics!

Ahora que esta herramienta muestra que muchos resultados son intermitentes, si Majestic se toma más tiempo para reaccionar a los mensajes de error, es muy probable que la amplia mayoría de los picos de Trust Flow desaparezcan. Esto tiene un inconveniente, por supuesto, porque será más difícil de grabar y propagar la información de servidores y sitios que normalmente se caen, pero parece ser que dar a una web el beneficio de la duda por un corto periodo de tiempo podrá crear índices más estables.

¿Por qué os ha costado “tanto tiempo” arreglar esto?

En resumen, no lo hemos hecho. ¡Un mes es un periodo enorme en búsquedas! Entender la relación entre sitios web es difícil. El movimiento hacía HTTPS parece haber descubierto problemas nuevos e imprevistos. El problema realmente  sólo se hizo evidente hace unas pocas semanas y empezamos inmediatamente nuestro mapeo para intentar entender el problema y trabajar en la solución.

Éramos incapaces de decir qué estaba ocurriendo, porque simplemente no lo sabíamos. De hecho aún no lo comprendemos totalmente, pero estamos acercándonos. Tuvimos que construir esta herramienta para saberlo. Afortunadamente, hemos estado guardando Flow Metrics después de cada actualización como parte de nuestra oferta empresarial de Majestic Analytics. Nuestro equipo de desarrollo puso todo esto junto en solo unas pocas semanas. De manera paralela, hemos tenido un equipo haciendo diagnósticos de comprobaciones y otro equipo mirando los datos en masa para intentar y parar problemas obvios. Todas estas vías nos han traído a esta herramienta, la cual hemos decidido lanzar inmediatamente para que nuestros usuarios puedan ver los problemas por sí mismos y también se beneficien de los datos extra que nuestra herramienta proporciona.

¿Por qué no es gratuito para todos los usuarios?

Simplemente porque no es una herramienta adecuada para cualquier usuario. Proporciona información matizada, la cual debería ser reservada a usuarios profesionales. Además, como mencionábamos al inicio, la tecnología está basada en los datos acumulados en un formato diferente a la mayoría de los datos de Majestic. No hemos sido capaces de testar la herramienta para usos gigantescos y el “coste” (en términos de tiempo de CPU) no es tan eficiente como muchas de las herramientas de Majestic. El uso eficiente de ordenadores es el por qué de que Majestic todavía tenga la mayor base de datos de enlaces en el mundo y el menor coste de entrada. En este momento sin embargo, la velocidad de lanzamiento fue más importante que el precio.

Para ti

Esperamos que hayas disfrutado de esta nueva línea de conocimiento. Estamos interesados en tus observaciones y en las maneras en las cuales encuentres que esta herramienta puede ayudarte a desarrollar tu negocio. ¡Disfrútala!

Save

Save