Entités et SEO : le Guide pour comprendre

Le SEO basé sur les entités est un domaine nouveau, regorgeant de possibilités, mais où tout reste encore à développer, qu’il s’agisse de la théorie, de la technique ou des outils permettant d’utiliser les entités pour optimiser son site.

Commençons par la compréhension de ce que sont les entités en SEO. De nombreux articles ont déjà été publiés sur les entités et leur rôle dans l’évolution du référencement Web.

Pour beaucoup de professionnels cependant, il reste difficile de comprendre pourquoi les entités permettent de mettre en place une stratégie de référencement pérenne et comment elles peuvent être utilisées pour améliorer les performances des sites web.

Ce guide a pour objectif de montrer pourquoi vous avez besoin d’entités pour rendre votre effort de référencement plus efficace et comment utiliser les entités pour améliorer le SEO on-page, consolider l’architecture d’un site et améliorer vos stratégies d’acquisition de trafic.

1. Qu’est-ce qu’une entité en SEO ?

Vous savez que SEO signifie Search Engine Optimization, c’est-à-dire la pratique consistant à augmenter la quantité et la qualité du trafic vers votre site web grâce aux résultats des moteurs de recherche organiques

Depuis le début, les SEO se sont principalement concentrés sur des mots-clés pour augmenter le trafic.

Le référencement basé sur les entités consiste à se concentrer sur les entités plutôt que sur les mots-clés. Dit comme cela c’est simple, mais cela requiert en fait un changement d’état d’esprit.

Qu’est-ce qu’un mot-clé ?

En SEO, un mot-clé est constitué d’un ou plusieurs mots saisis par un internaute dans un moteur de recherche comme Google ou Bing.

Depuis la création des moteurs de recherche, la notion de mot-clé a constitué la base des stratégies de référencement naturel, avec pour objectif d’assurer la visibilité d’une page dans les résultats des moteurs de recherche, pour un ou plusieurs mots-clés spécifiques.

Les mots-clés possèdent deux caractéristiques fondamentales:

  • Ils sont porteurs d’ambiguité. Un mot-clé peut désigner plusieurs sujets très différents. Le mot-clé « Cookie » peut ainsi faire référence au biscuit ou à la suite d’information envoyée par un serveur Web.
  • Un mot-clé est la plupart du temps spécifique à la langue. Le mot-clé « machine à laver » en Français correspond à « washing machine » en anglais ou « lavadora » en Espagnol.

Qu’est-ce qu’une entité ?

De manière générale, une entité (ou entité nommée pour être plus précis) désigne une chose ou un concept unique, bien défini, et qui peut être rattaché à un graphe de connaissance.

Au contraire d’un mot-clé, qui n’est en définitive qu’un assemblage de lettres spécifique à une langue, une entité est porteuse de sens et est indépendante de la langue et des mots-clés synonymes qui la désignent.

Plus précisément, dans le secteur du SEO, une entité concerne tout sujet pouvant être relié aux graphes de connaissance des moteurs de recherche, comme le Knowledge Graph de Google.

Sachant que ce même Knowledge Graph est essentiellement basé sur WIkipedia, pour simplifier, on appellera Entité tout sujet pouvant être rattaché à une page Wikipedia, qui ne soit ni une page de désambiguïsation, ni une page de catégorie.

Par exemple :

Type d’entitéMot-clé synonymeEntité correspondanteWikidata ID
PersonneTrumpDonald TrumpQ22686
LieuParisParis, FranceQ90
OrganisationAlphabetAlphabet IncQ20800404
EvénementCESConsumer Electronics ShowQ646089
Concept / ChoseSEOOptimisation pour les moteurs de rechercheQ180711

C’est à ce type d’entités que l’on trouvera dans les contenus d’un site, qu’il faut s’intéresser pour optimiser le SEO on-page et on-site.

A noter cependant qu’il existe d’autres types d’entités, comme vous, votre marque, votre société, qui tout en étant dépourvues de pages Wikipedia, peuvent être rattachées à d’autres Knowledge Graphs (comme Google MyBusiness ou Linkedin). Cependant, l’optimisation de ces entités ne permettra d’améliorer que votre réputation, pas votre SEO.

Erreurs fréquemment rencontrées au sujet des entités

On trouve sur le Web beaucoup d’erreurs au sujet des entités dans le cadre du SEO. Il nous semble essentiel de lever ici toute ambiguïté ou confusion.

Erreurs rencontrées dans la littérature SEO

Prenons par exemple cet article publié dans Search Engine Watch au sujet de l’optimisation des contenus à l’aide des entités.

L’auteur y déclare que « joueur », « meilleures chaussures de basket » et « basket » sont des entités découvertes par Google lors de l’analyse d’un texte portant sur le basketball.

capture d'écran Google NLP
Résultats de l’analyse d’un texte par l’API Google NLP

Quelles sont les erreurs commises ici ? Meilleures chaussures de basket-ball (Best Basketball Shoes en anglais) ne désigne certainement pas une entité, car il n’existe aucune page Wikipedia sur ce sujet.

Basketball shoes n’est pas non plus une entité. Il s’agit d’un mot-clé synonyme faisant référence à l’entité Sneakers.

Quand au mot Nike, il fait référence à l’entité Nike, Inc. Cette entité a été correctement détectée par Google NLP, qui associe au mot Nike le lien correspondant vers la page Wikipedia de l’entité Nike, Inc.

Ce qu’il faut retenir de cela:

Google ne liste que des mots-clés dans l’interface de son API de language naturel. Les entités correspondent aux liens Wikipedia associés à chaque mot.

Autres erreurs rencontrées

L’exemple que donne Wikipedia sur sa page concernant les entités nommées prête également à confusion.

Il y est ainsi écrit que dans la phrase « Trump is the president of the United States« , seuls Trump et United States sont des entités, alors que President n’est pas une entité puisque ce mot peut faire référence à de nombreuses entités différentes.

Cette affirmation est erronée pour les raisons suivantes:

  • Trump est un mot clé synonyme de l’entité Donald Trump (et donc le mot Trump n’est pas en soi une entité, il peut aussi faire référence, en fonction du contexte, à l’entité Trump (card game) en anglais, c’est à dire Atout en Français)
  • De la même manière, President est un mot-clé synonyme de l’entité President of the United States (identifiée dans le Knowledge Graph de Google par l’ID /m/060d2), qui peut être facilement désambiguïsée par l’analyse du contexte de la phrase, d’autant que cette entité est exactement nommée dans la phrase ci-dessus.

La phrase donnée en exemple par Wikipédia fait en définitive référence à 3 entités: Donald Trump, President of the United States et United States.

Terminologie employée par Google: Entités, Topics ou les deux ?

Comme nous allons le voir ci-dessous, Google utilise les entités dans la plupart de ses services Web (Google Search, Google Discover, Google News et Google Trends notamment).

En revanche, Google n’utilise quasiment jamais le terme Entité, lui préférant le terme de Sujet en Français ou Topic en Anglais, comme le montrent les copies d’écran ci-dessous. Tous les « Topics » mentionnés sont en réalité des Entités.

Il est donc important de se méfier de la manière dont Google nomme les choses (mais vous le savez probablement déjà).

2. Comment Google utilise-t-il les entités ?

Pourquoi Google utilise les entités

Avant de répondre à la question du Comment, il est intéressant de s’interroger d’abord sur le Pourquoi. Pourquoi les entités sont-elles aujourd’hui au cœur des algorithmes et services de Google et pourquoi elles ont à présent tendance à remplacer peu à peu les mots-clés ?

La raison est simple.

Si Google utilise les entités, c’est parce que ces entités permettent de connecter ensemble toute l’information mondiale, indépendamment de la langue, qu’elles permettent de comprendre le sens de cette information ainsi que les centres d’intérêts de ses utilisateurs.

Utilisation des entités par Google, exemple

En détectant les entités contenues dans les pages Web, Google pourra mettre en relation deux sites parlant de la même chose dans des langues différentes.

Dans l’exemple ci-contre, Google propose, via Discover, un article en Anglais à un utilisateur Français intéressé par l’entité « Optimisation pour les moteurs de recherche » (et qui a consulté auparavant des sites en anglais sur le même thème).

Nous allons voir que la personnalisation via les entités va bien au delà de Google Discover.

Quels sont les services de Google utilisant les entités ?

Dans son article paru en 2018 « Helping you along your Search journeys » (Vous aider dans vos recherches) Google revendique déjà de détecter et d’indexer les entités contenues dans toutes les pages Web publiées sur le Web, avec de nombreuses applications à la clé.

S’il fallait résumer l’ensemble de ces applications, on pourrait dire que Google utilise les entités pour interpréter et catégoriser les pages web, établir des relations entre les entités (et donc entre les pages Web), et délivrer de meilleures réponses aux questions des internautes.

Le Knowledge Graph

Comme indiqué par Google, le Knowledge Graph  est utilisé par la recherche Google pour aider les utilisateurs à découvrir des informations plus rapidement et plus facilement. Ce Knowledge Graph contient la plupart des entités du monde réel telles que des personnes, des lieux et des objets et est rafraichi par un dump de Wikipédia tous les soirs.

L’utilisation du Knowledge Graph permet essentiellement à Google de:

  • Présenter des panneaux de connaissance pour les entités recherchées par les internautes,
  • Affiner les résultats de ses autres services en fonction des centres d’intérêt des utilisateurs.

L’utilisation des entités permet à Google de personnaliser les résultats délivrés par son moteur de recherche, en fonction des centres d’intérêt de ses utilisateurs et de son historique de recherche.

Sans rentrer dans le détail des mises à jour de l’algorithme de Google, celles-ci font depuis longtemps la part belle aux entités:

  • Google Hummingbird: avec cette mise à jour, Google a transformé la manière dont il traitait jusque là les requêtes des internautes en passant d’une approche basée sur les mots-clés (strings) à une approche basée sur les entités (things).
  • Google Rankbrain: RankBrain permet à Google de mieux répondre aux requêtes qu’il n’a jamais rencontré auparavant. Ceci est réalisé à l’aide des entités et d’une couche d’intelligence artificielle.
  • Google BERT: Cette mise utilise l’Analyse du Langage Naturel (Natural Language Processing ou NLP en anglais) pour comprendre les requêtes de recherche, interpréter le texte présent sur les pages web, et ainsi identifier dans les unes et les autres les entités et les relations qui les unissent.

Grâce à ces améliorations successives, Google est maintenant capable de reformuler les requêtes des internautes et, c’est probable, reformuler aussi le contenu des pages Web.

Les suggestions de recherche délivrées par Google incluent également de plus en plus de suggestions d’entités.

entités dans les suggestions de recherche de Google
Suggestions de recherche Google – 3 entités affichées en 2e, 3e et 4e suggestions

En cliquant sur la deuxième suggestion ci-dessus, celle pour « Pomme », la chanteuse, on obtient une liste de résultats assez étonnante car comportant peu d’erreurs (pas de recette à base de pommes par exemple), qui montre bien que Google délivre des résultats de recherche en se basant uniquement sur les entités et plus seulement sur les mots-clés.

Résultats de recherche pour une entités précise
SERP de Google pour l’entité Pomme (chanteuse)

Google Discover

Comme vu plus haut, tous les résultats proposés par Google Discover sont basés sur les centres d’intérêt d’un utilisateur, c’est à dire les entités contenues dans les pages Web qu’il consulte. A partir de ces pages, Google construit ce qu’il appelle le « Topic Layer » (lisez Entité pour Topic), c’est à dire le graphe des centres d’intérêt de chaque utilisateur.

A chaque fois qu’un nouvel article est publié sur le Web incluant l’un des ces centres d’intérêt, Google sera susceptible de le proposer à l’utilisateur correspondant dans Google Discover.

Google propose deux types de recherche sur son outil de tendances:

  • La recherche par « terme de recherche », c’est à dire par mot-clé
  • La recherche par « sujet », c’est à dire par entité.

Voici l’exemple d’une tendance pour l’entité /m/060d2 déjà vue plus haut et accessible à l’URL https://trends.google.fr/trends/explore?date=now%207-d&geo=FR&q=%2Fm%2F060d2

Tendances Google pour une entité nommée

Comment Google détecte-t-il les entités ?

Les études que nous avons réalisées avec InLinks, et notamment au travers des Industry reports, montrent que Google ne détecte qu’en moyenne 20% des entités présentes dans un texte.

Ce résultat est obtenu en utilisant exclusivement l’API de Google NLP.

Cependant, nos études montrent que, dans de nombreux cas, l’API de Google ne détecte pas directement l’entité principale dans les articles qu’il propose sur Google Discover.

Il est donc raisonnable de penser que Google utilise différent moyens pour déterminer les entités présentes dans une page:

  • Un algorithme de NLP, similaire à son API (API qui détecte quasiment 100% des personnes, lieux et organisations, mais très peu de concepts / choses),
  • Des facteurs off-page, comme les entités détectées dans les autres pages du site (agissant comme entités contextuelles et permettant une étape supplémentaire de désambiguïsation)
  • Des facteurs on-page comme un balisage Schema.org permettant de préciser explicitement les entités présentes dans la page
Principe de détection par Google des entités dans une page web
Principe de détection par Google des entités dans une page web

Lire la suite: Comment utiliser les entités pour améliorer son SEO

Share this entry

Replies

2 réponses
  1. Florence
    Florence dit :

    Merci beaucoup Fred pour cet article on ne peut plus clair sur le sujet des entités et qui est magnifiquement optimisé SEO sans en faire trop. Et alors, que dire de l’excellent choix de Pomme !

    Répondre
  2. Serge-Jérôme
    Serge-Jérôme dit :

    Excellent article ! Vous m’avez donné une connaissance des plus claires et des plus riches pour comprendre ce que sont les « entités nommées ». Très intéressant pour une stratégie d’optimisation seo.

    Répondre

Laisser un commentaire

Rejoindre la discussion?
N’hésitez pas à contribuer !

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *