Le moteur de recherche Google domine largement le marché, mais de nombreuses alternatives existent pour les internautes souhaitant modifier leurs habitudes de navigation. Ces moteurs de recherche alternatifs, bien que moins populaires, présentent des fonctionnalités innovantes et des approches différentes en termes de confidentialité des données ou de nature des résultats.

Avec une part de marché dépassant 90% dans la plupart des pays, Google s’impose sans conteste comme le moteur de recherche dominant dans le monde. Plusieurs facteurs expliquent cette suprématie.

Tout d’abord, Google a su innover en matière de technologie de recherche dès ses débuts en 1998. Par ailleurs, Google bénéficie d’une expertise technique considérable grâce à ses puissants data centers indexant des milliards de pages web. En outre, la position dominante de Google lui permet de capter l’essentiel des recettes publicitaires liées aux recherches.

Bien que leader incontesté, Google fait face à une concurrence croissante d’alternatives crédibles sur le marché des moteurs de recherche.

Alternatives Généralistes à Google

Bing

Propulsé par Microsoft, Bing s’est imposé depuis son lancement en 2009 comme le principal challenger de Google sur le marché des moteurs de recherche généralistes. Bing se distingue avant tout par l’excellente qualité de son moteur de recherche d’images et de vidéos. Grâce à de puissants algorithmes de reconnaissance visuelle, ce dernier surpasse Google sur la recherche multimédia. Côté interface, Bing a opté pour un design épuré mettant en valeur les résultats. Les fonctionnalités de recherche avancée sont bien conçues, avec des filtres par date ou type de résultat.

Lire aussi: Source Code Moteur PHP MySQL

Yahoo

Présent sur le web depuis 1994, Yahoo fut l’un des tout premiers moteurs de recherche avec Excite et Altavista. Aujourd’hui, Yahoo s’appuie principalement sur les résultats de recherche de Bing tout en les complétant avec son propre référencement.

Baidu

Véritable institution en Chine, Baidu détient plus de 70% de parts de marché sur les recherches depuis sa création en 2000. Grâce à une indexation très fine des contenus locaux, Baidu répond efficacement aux recherches des internautes chinois dont il maîtrise parfaitement les subtilités de la langue. Cependant, l’opacité des algorithmes de Baidu est souvent dénoncée. Le moteur est accusé de manipuler les résultats selon les intérêts du parti au pouvoir.

Yandex

Yandex s’est imposé depuis sa création en 1997 comme le moteur de référence en Russie avec près de 60 % de parts de marché. Avec des algorithmes performants, Yandex offre des résultats très pertinents, en particulier sur les recherches locales. Yandex propose également des services variés : cartographie, actualités, messagerie, météo… Il est devenu un portail incontournable en Russie.

Moteurs de Recherche Axés sur la Confidentialité

De nouveaux acteurs se positionnent sur le créneau de la protection des données personnelles.

DuckDuckGo

DuckDuckGo se présente comme le moteur de recherche respectueux de la vie privée. Contrairement à Google, il ne piste ni ne profile ses utilisateurs à des fins publicitaires. L’interface épurée et le design coloré sont les points forts de DuckDuckGo. Son bouton « Fire » permet d’effacer instantanément ses données privées.

Lire aussi: Analyse Fiabilité Moteurs Essence

Qwant

Qwant est le moteur de recherche français positionné sur le respect de la vie privée. Créé en 2013, il affiche la protection des données comme valeur fondatrice. Bien qu’encore limité, Qwant connaît une croissance rapide portée par les préoccupations des Européens pour leurs données en ligne.

Brave Search

Issu du navigateur du même nom, Brave Search se positionne comme un moteur de recherche libre et transparent, sans aucune publicité ni traçage. Brave met en avant la protection totale de la vie privée et des données personnelles.

Moteurs de Recherche Écologiques

Ecosia

Basé en Allemagne, Ecosia se présente comme le premier moteur de recherche écologique. À chaque requête sur Ecosia, il est possible de connaître le nombre d’arbres plantés grâce à ses utilisateurs. Le moteur met en avant sa transparence sur l’utilisation des fonds. Avec seulement 0,1% de parts de marché, Ecosia reste marginal mais sa croissance régulière lui permet de financer de vastes projets de replantation d’arbres.

Autres Moteurs de Recherche Notables

  • You.com: Offre des résultats plus pertinents et personnalisés grâce à l’intelligence artificielle.
  • Neeva: Un moteur de recherche payant sans publicités.
  • Startpage: Se décrit comme le moteur de recherche le plus privé du monde.
  • OneSearch: Le moteur de recherche de Verizon, axé sur la confidentialité.
  • Search Encrypt: Utilise le cryptage local pour protéger les informations personnelles.

Méta-Moteurs de Recherche

  • Searx: Un métamoteur qui utilise les données de partenaires pour la recherche.

Moteurs de Recherche et Engagement Social/Écologique

  • Lilo: Un moteur de recherche français et solidaire qui permet de soutenir des projets solidaires avec chaque recherche.
  • Ekoru: Un autre moteur de recherche écologique.
  • Youcare: Transforme les recherches en actions positives grâce aux revenus publicitaires.

Au-delà des Moteurs de Recherche Traditionnels

Youtube, le site de partage de vidéos, est de plus en plus utilisé comme un moteur de recherche internet. Il compte par exemple plus de recherches mensuelles que DuckDuckGo, pourtant déjà très connu.

L'Ère des Moteurs de Réponses Basés sur l'IA

Depuis 2023, une nouvelle génération d’outils bouleverse les usages liés à la recherche d’information : les modèles de langage génératif (LLM pour Large Language Models). Contrairement aux moteurs classiques qui renvoient une liste de liens, ces outils fournissent directement des réponses à l’utilisateur, souvent accompagnées de sources, de tableaux de comparaison ou de recommandations.

Lire aussi: TCe 160 Renault : Analyse de la fiabilité

Pour les utilisateurs, le gain de temps et la richesse des réponses font de ces IA des alliés du quotidien. Si Google reste le moteur de recherche dominant, l’arrivée des LLM rebat les cartes.

  • ChatGPT: Un chatbot qui répond rapidement à toutes les questions.
  • Perplexity: Un moteur de recherche basé sur l’IA qui ne nécessite pas de créer un compte.

CodeCrawler : Un Moteur de Recherche Open Source pour le Code Source

Ce mois-ci, un groupe de développeurs de l'université de Illinois-Urbana Champaign a annoncé la sortie de CodeCrawler, un moteur de recherche Open Source permettant aux développeurs de rechercher des codes sources.

Lorsqu'un développeur cherche un source, il utilise la plupart du temps un grep. Ce type d'outil cherche des chaînes de caractères correspondant à une expression régulière. Aussi puissante soit-elle, cette technique présente plusieurs inconvénients.

Tout d'abord, l'écriture d'expressions régulières nécessite de savoir un tant soit peu ce que l'on cherche (un préfixe de nom de variable, etc.). Ensuite, le résultat de la recherche retournée par un grep liste toutes les occurrences d'une expression régulière avec la même pertinence. Le développeur se retrouve parfois avec des centaines de résultats sans savoir exactement dans lequel commencer l'exploration. Enfin les outils grep font partie du système d'exploitation ou de l'IDE et les résultats ne peuvent être visualisés à travers le Web.

Dans les langages de programmation, les identifiants sont souvent composés de plusieurs mots, par exemple ListArray, basic_string…

CodeCrawler combine le meilleur des moteurs de recherche Web et des outils grep, et les étend avec une connaissance des langages de programmation et de la sémantique des codes sources pour permettre une recherche plus intelligente et pour déterminer la pertinence des résultats de la recherche.

CodeCrawler fournit une interface Web permettant à l'utilisateur d'effectuer une requête sur des expressions régulières (comme grep), sur des mots-clés (comme une recherche Web) et en utilisant des extensions spécifiques à la programmation. Les résultats retournés sont rangés par pertinence, en prenant en compte la sémantique du code source (classe, méthode, variable…) et pointent vers les codes sources d'origine.

Le principe de fonctionnement est simple. L'administrateur installe CodeCrawler et configure les entrepôts de codes sources pour la recherche (pserver CVS, WebDAV, système de fichiers local). CodeCrawler construit alors un index de recherche pour les codes source en analysant chaque fichier source et en extrayant l'information sémantique importante.

Typesense : Un Moteur d'Indexation et de Recherche Open Source

Typesense est un moteur d’indexation et recherche distribué sous licence open source GPLv3. C’est une alternative à Algolia (SaaS), ElasticSearch (ex-vrai open source), OpenSearch (fork open source de ElasticSearch initié et mené par Amazon) ou MeiliSearch (autre moteur open source).

Typesense permet d’indexer des collections de documents afin de faire de la recherche full-text sur les champs définis / requêtés des documents indexés.

Typesense propose plusieurs modes d’installations, ainsi qu’un déploiement en cluster pour les architectures et systèmes traitant de gros volumes de données.

Typesense plus simple à appréhender, installer, configurer et administrer qu’ElasticSearch ou son fork, OpenSearch. Plus simple aussi, à mon sens, que MeiliSearch, l’autre alternative open source aux deux premiers, qui nécessite de gérer un serveur frontal (Nginx, Caddy, Apache, HA Proxy) en amont.

Tout comme les autres solutions concurrentes du marché, Typesense se gère principalement via une API RESTful, elle aussi très accessible :

  • des endpoints en écriture pour déclarer les schémas de documents
  • un endpoint en écriture pour insérer et indexer les données
  • un endpoint en lecture pour requêter des documents (avec des paramètres de filtrage, tri, pagination, sélection de champs, etc.)
  • des endpoints d’administration et monitoring

Pour permettre aux utilisateurs d’un site d’effectuer des recherches via Typesense, il convient d’ajouter du code ou d’intégrer des composants / libs UI côté front-end.

Typesense est compatible avec InstantSearch le composant de barre de recherche intelligente initié, développé et maintenu par Algolia (merci à eux).

Typesense fournit une API permettant de gérer des collections, documents, de la recherche - textuelle, géospatiale (via la saisie de coordonnées longitude et latitude, ainsi qu’un périmètre de correspondance) ou vectorielle -, des synonymes ou alias, etc.

L’API Typesense comprend aussi un endpoint GET /health afin de monitorer l’état (d’un nœud) du système.

Autre endpoint intéressant (pour du monitoring / alerting DevOps) : GET /stats.json qui fournit des informations telles que le nombre moyen de requêtes par seconde, ou la latence moyenne de toutes les requêtes au cours des 10 dernières secondes.

Typesense propose d’autres endpoints d’administration pour réaliser des opérations de backup des données, gérer les nœuds pour les systèmes clusterisés, ou gérer des logs / de la config.

Pour finir, Typesense permet de générer et gérer plusieurs clés d’API, avec des portées et droits plus ou moins élevé, depuis la lecture seule sur un type de document, jusqu’à l’administration complète du système.

Le tout est intuitif tout en paraissant suffisamment complet.

La communauté Typesense met à disposition une CLI non-officielle.

Typesense maintient et met à disposition une collection Postman officielle avec les différents services consommables via l’API Restful (ainsi que la config des variables d’environnement).

Par défaut, Typesense ne fournit aucune interface graphique d’administration de la plateforme ou des objets (collections, documents). En revanche, ils en proposent une avec la version SaaS.

Heureusement, des âmes charitables se sont emparé du sujet et proposent une application web open source : typesense-dashboard.

Typesense Dashboard est plutôt complet et permet de connaître l’état du système (ressources consommées, mémoire, etc.), de gérer (CRUD) les collections et documents, d’effectuer des recherches, de tester des requêtes, etc.

Contrairement à Algolia, Typesense ne propose pas de bibliothèques de composants UI sur étagère ou built-in.

Cependant, Typesense maintient et met à disposition plusieurs clients dans différents langages (JavaScript, PHP, Python, etc.).

Le plus simple, pour intégrer le moteur de recherche à son site, est de suivre le guide officiel, et en particulier s’inspirer ou cloner l’application de démo (ce que j’ai fait).

Pour voir ce qu’il est possible de faire simplement grâce à Typesense et InstantSearch, je vous invite à consulter la page des démos en ligne.

tags: #moteur #de #recherche #code #source #open

Articles populaires: