Resumen ejecutivo:

Investigaciones sobre lo que nosotros llamamos “Enlaces de autoridad” revelan que el propio concepto podría ser incoherente con los sistemas de recuperación de grandes datos de hoy en día. A pesar de que los enlaces tienen una importancia relevante en los rankings, existen paradojas que el especialista SEO debe explorar. Este artículo resume la investigación llevada a cabo durante años y ofrece nuevas definiciones sobre qué podría ser un “Enlace de autoridad”.

La semana pasada, en la Pubcon, discutimos sobre los “Enlaces de Autoridad” y este post tiene en cuenta cómo la investigación ha cambiado con los años y sugiere algunas nuevas formas de ver lo que Google y, de forma independiente, Majestic podrían entender como “enlazar”.

Una búsqueda (desde un número IP con sede en EE.UU.) de la frase “definición de enlace de autoridad” podría, razonablemente, mostrar resultados de las investigaciones actuales sobre qué constituye “autoridad” cuando los enlaces son usados como un factor de ranking en Internet.  Sin embargo, los resultados que encontramos están muy lejos de esa utopía.

Authority-Link-definiton

En términos generales, los resultados obtenidos en Octubre de 2015 pueden dividirse en dos grupos: “Hubs” (resultados de sitios que tratan de explicar varios conceptos y actuar como puente para los usuarios hacia otras fuentes de autoridad); y “Autoridades”, sitios o páginas que podrían ser considerados en sí mismos como una autoridad predominante. Este comportamiento del resultado de la búsqueda es totalmente coherente con la investigación llevada a cabo hace años en la Universidad de Cornell (1999) por Jon Keinberg (1) en “Hubs & Authorities”.

Los resultados que ofrece Google no son para nada satisfactorios para el usuario. El primer resultado de “Autoridad” es de Moz.com, pero en realidad, es una definición de “Autoridad de Página” – una métrica específica de Moz – no de “Enlace de Autoridad”. Otros resultados de lo que podrían considerarse fuentes de autoridad incluyen a Julie Joyce en Search Engine Watch (2012), Chris Brogan del NY Times en 2008 y Webmaster World ¡en 2005!(2)

Estos resultados ofrecen páginas muy viejas, en términos de Internet. ¿Es que la investigación sobre los “enlaces” no se ha movido lo suficiente desde 2005 para robar esas posiciones en los resultados de búsqueda de Google?

En un intento de encontrar una definición válida de “Autoridad”, encontramos una búsqueda que podemos destacar entre los resultados de Google.com. La premisa para la búsqueda era que si “autoridad” era interpretada como “enlaces que Google considera autoritarios”, entonces el propio Google debería ser la fuente principal para la respuesta definitiva. De hecho, los resultados fueron inundados por resultados feedproxy (terceros), con sólo una primera página de resultados escrita por el propio Google.

Authority-Link-definiton-google

Este resultado (Link schemes – Search Console Help) dirige únicamente a los usuarios a una página donde se detallan las consecuencias de trabajar con el concepto de “autoridad de los enlaces”. La página hace varias citas sobre lo que considera un Esquema de Enlaces (Link Scheme) (3):

•    “Cualquier enlace destinado a manipular el PageRank o la posición de un sitio en los resultados de búsqueda de Google puede ser considerado parte de un esquema de enlaces…”
•    “…y una violación de las directrices para webmasters de Google…”
•    “Esto incluye cualquier comportamiento que manipule enlaces hacia su sitio web o enlaces salientes desde su sitio”.

Esto sugiere que Google decide no aceptar la noción de “Enlace de autoridad” y, tal vez que incluso manipularlos puede penalizar a aquellos que tienen como objetivo realizar acciones para desarrollar enlaces de autoridad. Pero al mismo tiempo, el hecho de que existan estas advertencias sugiere que Google todavía utiliza los enlaces dentro de sus algoritmos y por lo tanto, los enlaces todavía son un factor relevante y significativo como factor de posicionamiento.

Esto plantea la pregunta sobre si las investigaciones llevadas a cabo desde los estudios de la Universidad de Cornell (Kleinberg) se han orientado hacia la dirección donde el término “Enlace de autoridad” ha perdido significado.

Un Enlace de “Autoridad” reduce la Autoridad

Una paradoja de la teoría HITS (LINK WIKIPEDIA) se ve también reflejada en los algoritmos de Majestic. Ni Majestic ni el algoritmo/enfoque HITS buscan duplicar los resultados de Google, pero ambos buscan entender y medir el concepto de Autoridad independientemente de la forma en la que Google llega a su propia conclusión. En el enfoque HITS, las Autoridades son menos propensas a enlazar a otras Autoridades que anteriores algoritmos habían propuesto [“Factor de Impacto” de Garfields (4)]. En cambio, los Hubs son propensos a enlazar sistemáticamente a las Autoridades. El algoritmo del Trust Flow (7) (Majestic 2014) también considera un enlace a una página web como una señal de confianza, pero sólo en la medida en que el enlace entrante venga de una página considerada de confianza.  En las tres metodologías, múltiples enlaces de una página reducen el impacto de Autoridad que pasa a través de esos enlaces.

Popularidad <>Autoridad

Una clara señal en el descubrimiento de que Google no necesariamente cree en sus propios resultados orgánicos cuando se trata de la definición de “Autoridad” se encuentra en un vídeo de Matt Cutts (Google, 2014) (5) donde señala que una web de autoridad, por ejemplo un portal sectorial controlado por el gobierno como podría ser la web de Distafarma (en español), la web del Ministerio de Sanidad de España con el procedimiento y el listado oficial de farmacias que venden online, puede no ser un sitio popular (comparado con webs más divertidas). Este no sería un resultado adecuado para una búsqueda de Google en la mayoría de las ocasiones, y el sitio oficial quizá no reciba muchos visitantes, sin embargo este sitio sigue siendo la autoridad en el sector.

Recientes investigaciones se orientan hacia entornos cada vez más medibles

Actualmente parece que hay un distanciamiento entre el enfoque de Majestic y el de Google sobre el tema de “Enlace de Autoridad”, aunque podemos seguir viendo un solapamiento significativo en los resultados de Majestic como indicador válido para considerar páginas que deberían tenerse en cuenta como fuentes relevantes para citaciones de un montón de temas y contenidos.

Google compró Freebase (una gran base de datos con información sobre empresas, en lugar de páginas web) en 2010, aunque finalmente, todos sus datos fueron archivados en 2015 (al parecer a favor de Wikidata). Freebase se basa en la identificación de Entidades en la web. Un sitio web puede considerarse una entidad, o también un contenedor de un conjunto entidades (pongamos que es un directorio, o una tienda online). En un sitio se pueden identificar otros muchos objetos y un recorrido (crawler) por la web podría contar el nº de veces que se mencionan o aparecen y evaluar la relevancia de estas entidades.

El concepto de “entidad” se manifiesta en principio en el desarrollo del GKG (Google’s Knowledge Graph), una base de datos de los hechos, personajes e información en lugar de una simple colección de páginas web. Sería razonable considerar que Google, por su lado, piensa que podría hacer un trabajo mejor si se considerase un ‘aglutinador’ o ‘conector’ de otros ‘conectores’ de internet, y está utilizando el Knowledge Graph a favor de estos sitios en sus resultados de búsqueda.

Sin embargo, las entidades del Knowledge Graph podrían ser en sí mismas consideradas como una señal natural de calidad, porque las entidades normalmente apuntan a páginas web que son, de forma oficial o extraoficial, representaciones de una entidad. Por ejemplo, si la entidad es una empresa, la ficha de esa entidad debería apuntar a la web de la empresa y a su perfil de Twitter.

Un artículo de Google Research (Teaching machines to read between the lines) pretende explicar cómo Google debería identificar estas entidades cuando recorre una página web pero, aún más importante, relacionar esas instancias (aparición de elementos) con la ficha de la entidad empresa en la misma base de datos. El artículo lo explica con el ejemplo siguiente:

tyco international

En este ejemplo concreto se pueden identificar varias entidades… Manhattan, David Boies y la SEEC, pero Tyco International y PriceWaterHouse han sido identificadas como ‘destacadas’ en el artículo. Los registros de Freebase identifican esto elemento con la ficha de Tyco International, donde podremos encontrar un registro con más detalles de la empresa. En este contexto, la mención a Tyco International y un enlace a la web en esta mención serán clasificados como ‘destacados’, que además se considerará como un voto por Tyco, pero no necesariamente por la página a la que se enlaza (su sitio web) sino a la propia empresa.

Este artículo no sugiere o propone una causalidad entre una entidad definida por Google y un enlace a la página que se cita en esa entidad de forma destacada, pero habríamos de contemplar de alguna manera cómo estas menciones (enlaces) podrían considerarse más relevantes porque viene de páginas que contienen entidades y menciones medibles.

A pesar de la interpretación de Google de ‘Enlace de autoridad’ Majestic debería considerar un enlace como ‘de autoridad’ solo en el contexto de temas relevantes.

Cómo Majestic intenta medir el Contexto

La anterior investigación de Google juega con la teoría de que el link building debería basarse más en la construcción de relaciones que en la construcción de enlaces. Si la entidad está guardada en una base de datos o tabla separada del dominio al que la web pertenece, la entidad gana autoridad a través de las menciones. Cualquier mención que la entidad realiza es, por tanto, de gran valor e implica una mención destacada (contextualmente relevante).

Majestic opta por elaborar, en un primer acercamiento al análisis de enlaces, por tratar de definir un link destacado (topical), primero por generar una serio de categorías (topics), y después, a través de un algoritmo similar al del Factor de Impacto de Gardfield, pasar valor al enlace solo en las categorías (o topics/temas) asociados a esa página. Aunque el algoritmo HITS (sobre Hubs y Autoridades) sugiere que los Hubs (concentradores) enlazan a Autoridades y estas raramente enlazan a nadie, Majestic utiliza la idea de que los Hubs no son Autoridades a no ser que, y hasta que, sean identificados como tal por otra Autoridad. De esta manera, los enlaces desde esas página también transmiten o ‘fluyen’ autoridad de acuerdo al contexto en que se encuentran. Majestic llamó a esto “Topical Trust Flow” (en español Trust Flow Temático, lo registró como marca, y trata  de defender esta visión.

Una sugerencia para la definición de “Enlace de Autoridad”

A pesar de que Google puede preferir no profundizar en el concepto de “enlace de autoridad”, en diversas ocasiones han reconocido que los enlaces siguen siendo un elemento central para la compresión que Google tiene de Internet, incluyendo los “reconocimientos” en vídeo de Matt Cutts. Majestic, por tanto, sólo puede presentar dos definiciones  sobre los “enlaces de autoridad”, con la confianza de que es Majestic quien te da esa definición de “enlace de autoridad”.

“Un enlace de autoridad es una mención legítima (link) desde un web temáticamente relacionada que tiene, además, un Topical Trust Flow relevante en el área temática. Ese Trust, esa confianza, es el resultado de la combinación de enlaces entrantes hacia la página así como de enlaces internos.

Una definición menos ajustada y nueva sobre los “enlaces de Autoridad” desde la perspectiva de Google sólo podrían dar pie a conjeturas, pero se ofrece para tenerla en cuenta también.

“Los enlaces destacados/prominentes a entidades, tal y como reconoce Google, aumentarán la autoridad de esas entidades, que a su vez pueden hablar (enlazar) como autoridades del contenido relevante de la web”.

Conclusiones

Este artículo comenta y evalúa de forma crítica la investigación existente en lugar de ofrecer una mayor investigación en la base, lo que sugiere que:

•    Autoridad < > Popularidad
•    Google usa las entidades y los enlaces y menciones a esas entidades, en última instancia, pueden afectar al ranking cuando esas entidades enlazan a otras páginas semánticamente similares.
•    El Tropical Trust Flow es un recurso independiente de Google para entender la autoridad de los enlaces en contexto.

Declaraciones y Referencias

Algunas de las opiniones expresadas en este artículo son opiniones personales del autor, a pesar de que actúa como representante de Majestic, por lo que este artículo en particular no debe ser tomado como una opinión o como política oficial de Majestic.

Referencias:

1: Jon Kleinberg, Cornell, Hubs and Authorities
2: “Link Authority Definition” as a search term on Google (Transient link)
3: Link Schemes. Google Webmaster Help
4: Garfield’s “Impact Factor” et al
5: Matt Cutts (Google, 2014)
6: Google Research  (PDF download)
7: Topical Trust Flow (Majestic 2014)

THANK YOU!
If you have any questions in the meantime, please contact help@majestic.com
You have successfully registered for a Majestic Demo. A Customer Advisor will contact you shortly to schedule a suitable time to connect.