SEU: Search Engine Understanding

Qu’est-ce que le S.E.U. ?

Le SEU, pour Search Engine Understanding, désigne la capacité des moteurs de recherche à comprendre un texte.

Il s’agit d’une analyse de la capacité de l’API de traitement du langage naturel du moteur à reconnaître toutes les entités ou sujets d’une page de contenu.

Les moteurs de recherche modernes (en particulier Google) ont évolué vers cette approche qui consiste à relier les concepts sous-jacents d’une page à leur graphe de connaissance. Cependant, l’analyse des mots et du texte et l’extraction des concepts sous-jacents ne sont pas toujours une science exacte. InLinks publie régulièrement des études de cas pour suivre la compréhension des concepts de Google dans différents secteurs, selon sa propre API de langage naturel.

Comment est calculé le SEU ?

Le calcul du SEU est effectué en comparant deux algorithmes différents de traitement du langage naturel (NLP). Le premier est l’API de langage naturel publique de Google et le second est l’API NLP propre à Inlinks (qui n’est pas publique actuellement). Nous examinons ensuite le nombre d’entités définies dans les deux ensembles de données pour obtenir un score en pourcentage du nombre de détection d’entités par Google, divisé par le nombre d’entités détectées par InLinks.

L’algorithme de détection d’entités d’InLinks est spécialement conçu pour être agressif lors de l’identification et de la désambiguïsation des entités d’un corpus de texte.

Cela signifie qu’InLinks détecte parfois des sujets qu’un humain considérerait incorrects (par exemple, nous pourrions voir dans ce texte un texte parlant d’un « moteur » et l’associer incorrectement à un moteur à combustion).

Cette approche agressive est toutefois importante pour les moteurs de recherche, car c’est le travail de l’optimiseur de contenu de veiller à ce que les entités CORRECTES soient communiquées à Google. (InLinks aide également à automatiser cette tâche grâce à la balise Schema.org/About)

Google utilise-t-il la même API dans son moteur de recherche que celle qu’il propose publiquement ?

Nous savons seulement que celle que nous utilisons est l’API Google officielle. Elle fait partie de la grande famille d’API Cloud Machine Learning de Google.

Comment utiliser cet indicateur ?

Nos études de cas sur la compréhension du langage naturel montrent que les meilleurs sites n’obtiennent en moyenne qu’un score d’environ 21 %, bien que ce chiffre varie considérablement d’un secteur d’activité à un autre.

Dans le secteur de l’éducation, par exemple, Genie Jones, de l’université de Warwick, a remarqué que le SEU est nettement meilleur, à 34 %.

Vous pouvez retrouver un comparatif des performances de SEU de Google en fonction de chaque secteur d’activité sur la page suivante:

Comment Google comprend les contenus publiés sur le Web?

A partir du moment où le score SEU d’un article est dans la moyenne des articles compétiteurs, il n’est pas nécessaire de chercher à augmenter ce score. En revanche, l’utilisation d’un code Schema.org/About permettra de s’assurer que les sujets important abordés dans un article sont effectivement compris par Google.

Share this entry

Category

Replies

0 réponses

Laisser un commentaire

Rejoindre la discussion?
N’hésitez pas à contribuer !

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *