De l’influence des données structurées

Les données structurées (schema) sont censées être implicitement définies par Schema.org. Néanmoins, il suffit d’ajouter et de renseigner les tags « About » et « Mentions », pour se rendre compte qu’on peut améliorer considérablement la capacité de Google à comprendre le contenu de la page. Chose qui, à son tour, peut renforcer votre visibilité dans les résultats de recherche. En seulement quatre lignes, avouez qu’on a déjà parcouru pas mal de chemin !

La question de savoir si les données structurées améliorent le classement a fait l’objet d’une certaine controverse. John Muller et Glen Gabe ont eu un échange sur Twitter qui a été repris par SE Roundtable l’année dernière et la réponse était presque énigmatique, mais claire quand on sait lire entre les lignes. L’ajout de données structurées contribue à la signification et au contexte, même si il ne permet pas d’améliorer « la puissance » d’une page, faute d’un meilleur terme. (Pour augmenter la puissance, il est utile d’ajouter des liens contextuels pertinents dans la page. Heureusement, vous êtes tous des utilisateurs d’inLinks, n’est-ce pas ? Donc vous le saviez déjà…

Les recherches confirment cette idée. Une bonne utilisation des propriétés « About » et « Mentions » de la page Web permet de contourner les lacunes de l’algorithme NLP de Google. Dans un brillant et amusant exposé présenté  en 2015 à San José, Jarno Van Driela démontré à quel point les données structurées sont précieuses pour le référencement :

Le pouvoir des données structurées d’un site web par Jarno van Driel

« Les pages web enrichies sémantiquement ont généré un trafic référencé par les moteurs de recherche nettement plus important que les pages non enrichies ou moins enrichies ». – JARNO VAN DRIEL

Schema markup 101

Le balisage des données structurées se présente sous des formes apparemment illimitées, mais il est ajouté aux pages web de l’une des trois manières suivantes :

  • – Microdata imbrique les métadonnées dans le code HTML existant.
  • – RDFa a été proposé par le W3C pour ajouter des attributs au HTML.
  • – Json-LD utilise des javascripts pour transmettre le sens, généralement dans la zone d’en-tête.

Chez InLinks, nous préférons, et de loin, utiliser le schéma JSON-LD, car Google a répété à plusieurs reprises qu’il s’agissait de sa préférence (voir la citation à la fin de cet article). De plus, il est beaucoup plus facile de voir le balisage de la page web regroupé en un seul endroit. Cette méthodologie permet également d’injecter facilement du schéma dans une page, en appelant des fichiers Javascript compilés à l’aide du moteur NLP d’InLinks, plutôt que de devoir continuellement mettre à jour le code brut sur le site web lui-même. Eh oui !

Le vocabulaire de la structuration de données

Bien qu’il existe, nous l’avons vu, trois façons prédominantes de baliser le schéma, le vocabulaire reste riche et est toujours en pleine expansion. Schema.org est devenu le forum de référence pour la définition d’un nouveau vocabulaire ou le développement de nouvelles idées. Le schéma « WebPage » est lui-même une propriété du schéma « Creative Work ». L’œuvre créative (dans ce cas, la page web elle-même) est (littéralement) « à propos » de certaines « choses » et « mentionne » d’autres « choses ». En examinant le contenu de la page et en isolant les sujets principaux du contenu et les sujets secondaires mentionnés dans le contenu, il est facile de les représenter dans le balisage, ce qui permet d’indiquer clairement le sujet de la page et les sujets qui y sont associés et d’aider les moteurs de recherche à l’analyser et la comprendre.

Moteurs de recherche et sites web

Les moteurs de recherche parviennent à interpréter le sens d’un texte sans balisage, mais le sens est alors uniquement implicite. Cela signifie qu’un moteur de recherche comme Google doit extraire par lui-même le sens du texte, au lieu d’être explicitement informé de celui-ci, en amont, par le balisage. En fait, les données structurées font le lien entre ce qu’un humain lit et ce qu’un ordinateur interprète. Elles aident le moteur de recherche à mieux comprendre ce qu’il est sur le point d’analyser.

Qu’est-ce qui fait que les propriétés des données structurées génèrent plus de trafic organique ?

Sans vantardise, l’algorithme NLP d’InLinks s’avère beaucoup plus performant que l’algorithme NLP de Google pour repérer les sujets dans le contenu. Prenons un exemple clair, en utilisant l’outil gratuit mis à votre disposition sur la page d’accueil d’inlinks.com. Nous avons analysé la page scientifique du New York Times du 19 octobre 2023. L’algorithme NLP de Google a trouvé 8 sujets, mais inLinks en a repéré 48, soit 6 fois plus !


La compréhension d’une page par les moteurs de recherche est limitée. Le schéma InLinks permet de résoudre ce problème en augmentant, malgré eux, leur capacité d’analyse. Il s’agit, en quelque sorte, de les prendre par la main…

En ajoutant les principaux sujets dont traite la page web dans le tag « About » du balisage, Google est en mesure de lire et d’assimiler facilement ces concepts et de les ajouter comme s’ils avaient été trouvés dans sa propre analyse NLP. Le fonctionnement est le suivant :


Suggestions de schéma SameAs pour la page scientifique du NY Times

Ce texte figure dans l’en-tête de la page web. Il indique que la page web traite de la « science » (la chose) et de l’organisation « New York Times ». On pourrait arguer que ce type de contenu n’e concerne pas le ‘a rien à faire dans le New York Times, ce qui est un débat légitime… Je me réjouis de cette discussion dans les commentaires, mais en tout cas, le sujet de l’article est bel et bien la science. Pour que le concept de « science » soit parfaitement clair, les données renvoient également à l’URL sans ambiguïté de Wikipédia sur le sujet. Soit dit en passant, Wikipédia est un excellent outil de désambiguïsation. Le principe est peut-être mieux démontré dans la propriété « mentions », où l’occurrence « virus » renvoie au sens pathologique du mot, plutôt qu’au sens de contagion informatique.

Les Citations dans cet article :

Share this entry

Category

Replies

0 réponses

Laisser un commentaire

Rejoindre la discussion?
N’hésitez pas à contribuer !

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *