L’étrange cas de la recherche par mots clés (et les mesures prises pour y remédier)

Keyword search

Interro surprise : comment la technologie a-t-elle changé au cours des 25 dernières années ?

La réponse (évidente) est : du tout au tout. Téléphones portables, e-mails, connexion Internet, etc. Il est plus difficile de nommer ce qui n’a pas changé.

Il y a pourtant bien une chose qui, depuis plus de 20 ans, connaît un franc succès sans pour autant avoir vraiment évolué : la recherche par mots clés. Nous vous entendons contester en disant que la recherche a changé de manière radicale depuis les années 90. Et vous avez raison. Cette période a vu de grandes améliorations apportées à la recherche des consommateurs, essentiellement grâce à Google. Mais il reste un domaine de la recherche qui semble ancré dans le passé et qui, malgré cela, n’a jamais été aussi populaire, la recherche par mots clés. Cette méthode de recherche sous-tend les sites Internet de la majorité des entreprises, mais utilise une technologie qui se trouve à des années-lumière de l’expérience de recherche proposée par Google.

Comment cela est-il possible ? Comment la recherche de mots clés est-elle restée si populaire pendant si longtemps ? Comment cette technologie n’a-t-elle pas encore rejoint les fax et les modem ? Pour répondre à ces questions, nous devons faire un petit voyage dans le temps et revenir à l’année 1994, qui marque l’invention du (deuxième) moteur de recherche de mots clés le plus important jamais conçu.

Des hyperliens ? C’est ça, oui…

À l’avènement du « World Wide Web », l’année 1994 a signalé l’explosion de la recherche par mots clés. Vous connaissez sans aucun doute cette méthode où vous saisissez un mot clé dans une barre de recherche, disons « collier de surfeur » (histoire de vraiment replonger dans les années 90), et véritablement trouver des liens vers des pages mentionnant les colliers de coquille de puka. 

À l’époque, il s’agissait d’un progrès révolutionnaire. En l’espace de 36 petits mois, des douzaines de moteurs de recherche de mots clés ont été lancés, notamment Infoseek, Yahoo!, Lycos, Webcrawler, Looksmart, Excite ou encore AltaVista. Puis, en 1998, Google a lancé PageRank, qui s’est avéré le meilleur algorithme pour classer les résultats des recherches par mots clés effectuées par les internautes.

Mais c’est aussi à ce moment-là que la plupart des technologies de recherche ont cessé d’évoluer, soit il y a 23 longues années.

Cela s’explique simplement, à peu près à la même époque, Doug Cutting, ancien ingénieur chez Xerox PARC, a lancé Apache Lucene, un moteur de recherche par mots clés en open source. 

Et en quoi ce moment était-il si remarquable ? Parce qu’avec Lucene, les développeurs d’entreprise pouvaient ajouter un moteur de recherche de mots clés à leurs sites Internet, leurs applications d’entreprise, leurs help center, leurs sites de e-commerce et bien plus. Pour faire simple, il était à présent possible pour les visiteurs d’un site Internet d’effectuer une recherche sur le site même, sans devoir recourir à Google ou Ask Jeeves (paix à son âme). 

Il est même très probable que vous utilisiez encore aujourd’hui une technologie de recherche fondée sur Lucene presque aussi souvent que Google. Vous n’en avez tout simplement pas conscience. Lucene (ou ElasticSearch, conçu à partir de Lucene) alimente les recherches effectuées sur la plupart des sites que vous consultez. 

Mais voici le problème : bien que ces deux technologies étaient relativement similaires dans les années 90, la recherche Google en 2021 est largement supérieure à la recherche de mots clés fondée sur Lucene.  

Cela est dû au fait que Google ait lancé une technologie de recherche révolutionnaire appelée traitement automatique du langage naturel ou TALN.

Le chaînon manquant de la recherche par mots clés

Le TALN est une branche de l’intelligence artificielle (IA) portant sur la façon dont les logiciels peuvent assimiler, comprendre et manipuler la langue. En d’autres termes, il s’agit de la capacité d’un programme informatique à comprendre le langage humain de la façon dont il est parlé.

Le TALN est capable de comprendre des questions telles que « Quand Marco Polo est-il né ? » et vous répond « Le 15 septembre 1253 ». Cette réponse provient du Knowledge Graph de Google.

En revanche, la recherche par mots clés consiste à détecter les mots clés que vous avez saisis, comme « Polo ». Ces types d’expériences de recherche vous proposent pratiquement toujours une liste de liens bleus, basés sur chacun des mots clés saisis et qui mènent rarement à la réponse souhaitée. Nous sommes tous passés par là, n’est-ce pas ? Vous voyez une icône de loupe sur un site Internet, saisissez un mot clé et obtenez un ensemble de résultats inutiles et dépourvus d’intérêt. Et ainsi vous abandonnez votre quête, avec l’espoir de trouver ailleurs ce que vous cherchez.  

Soyons clairs : nos recherches sont toujours basées sur des mots clés. Nous pourrions soumettre une requête en disant ou saisissant « Marco Polo naissance ». La question n’est pas complète, mais cela importe peu, car le TALN comprend l’intention finale. La partie obsolète est la plateforme de recherche, qui reste incapable de discerner la différence entre une série de mots clés et une série de mots clés qui constituent implicitement une question.

Quelle alternative s’offre à nous ? Une expérience de recherche sur site, véritablement moderne, à l’image de Google. Une recherche moderne est constituée des quatre éléments suivants :

  1. Elle applique le TALN optimisé par une IA avancée pour comprendre les questions en langage naturel, comme dans l’exemple ci-dessus
  2. Elle utilise plusieurs algorithmes pour proposer différents ensembles de résultats 
  3. Elle offre une interface utilisateur (IU) dynamique
  4. Elle est basée sur un Knowledge Graph

Examinons ces quatre éléments de manière un peu plus détaillée.

La saisie

La recherche de mots clés fonctionne très bien avec la fonction « Ctrl+F » dans un document Word. Le problème est que souvent, les mots clés ne correspondent pas exactement à ce que vous cherchez.

Par exemple, dans le cas d’une recherche de mots clés où vous saisissez « Médecins à Lyon, dans le 2e arrondissement », vous n’obtiendrez aucun résultat.  

La raison pour cela est qu’à aucun endroit dans le site Internet de l’entreprise se trouve la combinaison exacte des mots « Médecins à Lyon, dans le 2e arrondissement ». Cette recherche se conclut donc par une expérience plutôt décevante. 

La recherche moderne, quant à elle, s’appuie sur une recherche en langage naturel fondée sur l’IA, afin de comprendre exactement ce que l’utilisateur cherche à savoir. La technologie est ainsi en mesure de comprendre des questions d’une grande précision comme « Médecins à Lyon, dans le 2e arrondissement, qui acceptent la Mutuelle Verte et parlent espagnol ». 

Algorithme simple vs algorithme multiple

La fonction de recherche « Ctrl+F » fonctionne très bien lorsqu’il s’agit d’un document de taille raisonnable comme un rapport d’étude ou même un livre de 500 pages. Il suffit pour l’utilisateur de cliquer sur « Prochaine occurrence » et parcourir de document de manière chronologique.  

Mais la croissance fulgurante du Web signifie qu’il contient des milliards de pages. Tenez-vous bien : le mot clé « Marco Polo » par exemple, est mentionné 207 millions de fois. Trouver la réponse souhaitée équivaudrait à rechercher une minuscule épingle dans une énorme botte de foin. C’est pourquoi il est essentiel que ces mentions soient classées. Ainsi, à partir de la fin des années 90, les moteurs de recherche de mots clés se sont concentrés à adapter leur algorithme de classement. Pour classer ces plus de 200 millions de résultats, les moteurs de recherche doivent s’armer d’algorithmes solides capables de classer les hyperliens en fonction de leur pertinence.

Cependant, la recherche moderne n’utilise ces (longues) listes de liens bleus qu’en dernier recours. 

Par exemple, la page de résultat de Google pour le mot clé « McDonalds » affiche 500 millions de résultats, mais seulement un lien vers un site Internet en début de liste : McDonalds.com. Les liens qui suivent sont à peine visibles. Google associe des extraits, des plans, des cartes de connaissance et d’autres éléments pour donner à l’utilisateur plusieurs options de réponse.

Chacun de ces éléments s’appuie sur un algorithme différent, et c’est ainsi qu’une recherche moderne sur site devrait fonctionner. Pour chaque requête soumise, appliquez-y plusieurs algorithmes et fournissez à vos clients un ensemble dynamique de résultats qui correspondent au mieux à ce qu’ils cherchent.

Hyperliens vs Answers

La recherche par mots clés fournit tout bonnement une liste d’hyperliens, classés par pertinence. Cela signifie que vous devez cliquer sur chacun des liens et lire les résultats. Votre quête n’en sera pas achevée pour autant : cette méthode de recherche vous met simplement dans la bonne direction.

La recherche moderne complète le cycle de recherche en répondantdirectement aux questions des utilisateurs, et en leur permettant de passer à la transaction dès l’étape suivante. 

Les utilisateurs peuvent choisir parmi une variété d’éléments pour répondre à leurs questions. Il peut s’agir d’extraits de questions-réponses extractives ou d’une liste extraite du Knowledge Graph, comme une carte ou une liste de personnes. Il peut parfois même s’agir de réponses directes tirées du Knowledge Graph.

Cerise sur le gâteau, lorsque les utilisateurs reçoivent leurs résultats, ils peuvent agir directement à partir de la page de résultats du moteur de recherche. Selon la requête soumise, l’ensemble de résultats offrira différents types d’interactions, notamment commander en ligne, obtenir un itinéraire, contacter l’entreprise par téléphone ou acheter un produit.

En quête d’expériences améliorées

La recherche moderne, basée sur les réponses et un algorithme multiple est une version améliorée en tous points de la recherche par mots clés des années 90. C’est de là qu’est née notre plateforme Answers. 

Appuyées par une plateforme de recherche complète, fondée sur l’IA et axée sur les réponses, les entreprises sont à présent en mesure de créer un Knowledge Graph unique et structuré, et d’offrir des réponses, et non plus des liens, où que les clients effectuent leur recherche : par le biais de services connectés comme Google et Siri ou sur leurs propres sites Internet, pages d’aide ou plateforme de e-commerce optimisés pour la recherche en langage naturel.

Faites vos adieux à la recherche par mots clés du passé et tournez-vous vers le futur grâce à la recherche basée sur l’IA.

Cliquez ici pour en savoir plus ou programmer une démonstration

Découvrez comment votre entreprise peut fournir des Verified Answers aux clients pour stimuler votre visibilité et votre chiffre d'affaires.

Planifier une démonstration