Résumé de section

  • Les chatbots proposent maintenant des fonctions de recherche. Comment ça fonctionne ? Et surtout, est-ce que ça fonctionne ?

    40 minutes de lecture

    • La recherche simple

      Nous l'avons vu, les robots conversationnels peuvent faire des recherches sur le web. Il s'agit d'une fonctionnalité optionnelle ou ponctuelle : l'IA peut chercher sur le web quand on lui demande ou quand elle détecte qu'elle a besoin d'informations actuelles.

      D'un point de vue technique, le processus reste assez basique et ne prend que quelques secondes :

      1. Le LLM transforme le prompt en mots-clés optimisés pour la recherche ;
      2. Il fait sa requête sur un index de moteur de recherche ;
      3. Il accède aux sites pertinents, puis combine le prompt original avec les informations qu'il vient de récupérer ;
      4. Il génère une réponse finale sourcée et en langage naturel.

      Schéma du processus du RAG dans une recherche simple.

      Ce processus est appelé RAG (Retrieval Augmented Generation ou génération augmentée par récupération).

    • Fonctionnement du RAG

      Voyons le processus du RAG de façon détaillée à travers cet exemple de prompt.

      Quels sont les derniers records sportifs en 2025 ?
      Étape 1 : Prompt utilisateur - L'utilisateur pose sa question en langage naturel.
       
      Analyse du prompt...
      Étape 2 : Analyse & Transformation - Le LLM détecte qu'il a besoin d'informations actuelles et transforme le prompt en requêtes optimisées, par exemple avec les mots-clés suivants : "records du monde 2025"
       
      Recherche sur le web...
      Étape 3 : Recherche web - Le système utilise les mots-clés pour interroger un index de moteur de recherche et accède aux sites pertinents (sites d'actualités sportives, pages officielles, articles 2025). 
       
      Génération de la réponse...

      Voici quelques-uns des records sportifs récents et notables en 2025 :

      Athlétisme
      • Mondo Duplantis (Suède) : record du monde de saut à la perche avec 6,30 m
      • Jakob Ingebrigtsen (Norvège) : record du monde en salle pour le 1500 m

      [...]

      4 sources

      Étape 4 : Génération augmentée - Le LLM combine le prompt original avec les informations récupérées pour générer une réponse en langage naturel, structurée, cohérente et à jour. 
      Étape 5 : Sources vérifiables - Les sources sont fournies, permettant de vérifier l'exactitude des informations présentées.
      Temps total du processus RAG : quelques secondes
    • Intérêt du RAG

      La fonction de recherche reposant sur le RAG permet de s'affranchir de certaines limites des LLM, notamment en s’appuyant sur des bases de connaissances externes (index des moteurs de recherche par exemple) plutôt que de se limiter à générer des mots s'enchaînant de façon probabiliste à partir de données d'entraînement parfois obsolètes. 

      De plus, l'utilisateur peut voir le processus entrepris par l'IA et vérifier les sources qu'elle a récupérées pour générer sa réponse, ce qui améliore la transparence et la fiabilité des informations et permet de réduire les hallucinations.

      Toutefois, cette recherche simple reste limitée : elle effectue seulement quelques recherches ciblées et ne garantit pas une exploration exhaustive du sujet. Pour des besoins de recherche plus approfondis, une autre approche existe : la recherche approfondie.

    • La recherche approfondie (deep search)

      Contrairement à la recherche simple qui effectue quelques requêtes ciblées en quelques secondes, la recherche approfondie (ou deep search) utilise le RAG de manière intensive et itérative.

      Concrètement, lorsqu'on lance une recherche approfondie, l'IA ne se contente pas d'une seule série de recherches. Elle suit un plan de recherche structuré et effectue de multiples cycles successifs de manière autonome : elle recherche des informations, analyse les résultats, identifie les manques ou contradictions, puis relance de nouvelles recherches plus ciblées. Ce processus peut impliquer 10 à 50 recherches ou plus, avec lecture complète de sources, croisement d'informations et vérification des données.

      Schéma du processus itératif du RAG dans une recherche approfondie.

      Temps total du processus RAG en deep search : plusieurs minutes

      Le résultat n'est plus une simple réponse conversationnelle, mais un rapport détaillé comprenant une synthèse argumentée, une analyse comparative des sources, et une bibliographie complète. Cette approche méthodique prend généralement 5 à 15 minutes, mais offre une profondeur d'analyse comparable à la démarche itérative de la recherche documentaire.

      Pour exemple, vous trouverez ci-dessous un rapport généré après une recherche approfondie sur ChatGPT.

    • Exemple de rapport détaillé généré en 9 minutes par la fonction deep search de ChatGPT 5.

    • Quelques limites de la recherche approfondie
      • le nombre de sources vraiment couvertes ne permet pas de considérer une recherche comme exhaustive ;
      • on reste dans un contexte de recherche web classique, les pages sélectionnées le sont davantage sur leur popularité que sur leur pertinence scientifique (ranking).
    • Quelles limites pour les fonctions de recherche ?

      La recherche approfondie, proposée par des outils comme Perplexity ou ChatGPT, est potentiellement utile pour des besoins académiques ou professionnels nécessitant une exploration large d'un sujet.

      De plus, la fonction de recherche, qu'elle soit simple ou approfondie, permet de combler certaines lacunes des IA génératives "basiques" : moins d'hallucinations, plus de transparence sur la façon de procéder, possibilité de vérifier les sources...

      Mais comme vous vous en doutez, il subsiste quelques limites. Voyons cela à travers 3 rapides études de cas.

    • Étude de cas 1 : "Quels sont les signes avant-coureurs d'une guerre civile ?"

      Dans cet exemple, nous avons demandé à Perplexity la question suivante : "Quels sont les signes avant coureurs d'une guerre civile ?".

      Observez l'extrait de la réponse ci-dessous. Quel problème pouvez-vous relever ?


      🤔 Prenez un moment pour réfléchir. Vous avez votre réponse ? Vérifiez ci-dessous 👇

      Si l'on observe les sources, on constate que la première référence est un site survivaliste (Plandesurvie). Mais les autres sources ne sont pas nécessairement académiques (Reddit, Boursorama...) et peuvent être orientées (exemple : sites survivalistes, politiques...). Perplexity est un moteur de recherche généraliste, les sources sélectionnées le reflètent. Dès lors, quel crédit donner à la réponse ?

    • Étude de cas 2 : "Do we really need more optimistic science-fiction?"

      Dans cet exemple, nous avons demandé à ChatGPT la question suivante : "Do we really need more optimistic science-fiction?".

      Observez l'extrait de la réponse ci-dessous. Quel problème pouvez-vous relever ?


      🤔 Prenez un moment pour réfléchir. Vous avez votre réponse ? Vérifiez ci-dessous 👇

      Contrairement aux moteurs de recherche classiques qui se contentent de présenter une liste de références, les outils d'IA peuvent présenter des réponses sans neutralité. Comme on peut le voir, la réponse prend position dès le début ("Yes") et en conclusion ("Yes, we truly need more optimistic science fiction"). Dès lors, comment faire pour trouver des réponses n'allant pas dans le sens de l'outil ?

    • Étude de cas 3 : "Quels sont les usages par les lycéens des IA génératives en général et de ChatGPT en particulier en 2025 ?"

      Dans cet exemple, nous avons demandé à Perplexity la question suivante : "Quels sont les usages par les lycéens des IA génératives en général et de ChatGPT en particulier en 2025 ?".

      Observez l'extrait de la réponse ci-dessous. Quels sont les deux problèmes que vous pouvez relever ?

      Note : cet échange a eu lieu en mai 2025.


      🤔 Prenez un moment pour réfléchir. Vous avez votre réponse ? Vérifiez ci-dessous 👇

      La présence de sources ne signifie pas absence d'erreurs. On constate deux erreurs factuelles sur l'extrait :

      1. L'outil semble associer les lycéens à la tranche 18-25 ans ("93 % des jeunes de 18 à 25 ans") pour une question portant spécifiquement sur les lycéens.
      2. L'outil n'est pas capable de comprendre le contexte. On le voit avec la mention "Depuis la rentrée 2025, des cours obligatoires sur l’IA [...] sont déployés en lycée..." alors que la question a été posée en mai 2025.

      Dès lors, peut-on faire totalement confiance à un tel outil ?

    • En résumé

      Comme pour tout outil de recherche d'information, il convient de s'interroger sur le périmètre et les réponses obtenues.

      Les moteurs de recherche augmentés à l'IA combinent les limites des deux technologies :

      1. Moteurs de recherche : interrogation sur les critères de sélection et de représentativité des sources, notamment dans un cadre académique ;
      2. IA : interrogation sur la neutralité et la fiabilité des éléments narratifs (rédigés) notamment pour les sujets polémiques ou les données factuelles.

      À l'ère de l'IA, il convient de redoubler de vigilance pour la recherche d'information et de faire encore plus preuve d'esprit critique.