SNT / Thème 2 : Le Web / Séance 4

Les moteurs de recherche

Dernière mise à jour le : 01/07/2024

Les moteurs de recherche

illustration moteurs de recherche

Dans cette séance, nous allons étudier les principes et les usages des moteurs de recherche. Nous nous attarderons, à la fin, sur l'algorithme PageRank utilisé par Google pour classer les résultats avec pertinence en tenant compte de la popularité des pages Web.

Diaporama d'introduction

Source diaporama : https://info-mounier.fr/snt/web/data/Moteurs_de_recherche.pdf

Les résultats fournis par un moteur de recherche

illustration moteurs de recherche

✍️ Question 1 : Utilisez votre navigateur habituel et saisissez dans la barre d'URL les termes "Emmanuel Mounier" puis validez. Quel est le moteur de recherche utilisée par défaut dans votre navigateur ?

✍️ Question 2 : Effectuez la recherche "Emmanuel Mounier" sur les trois moteurs de recherche proposés et complétez le tableau.

Moteur de recherche Présence d'une annonce de publicité en tête des résultats Position du premier lien vers Wikipédia Position du premier lien vers le site du lycée
Google
Qwant
DuckDuckGo

✍️ Question 3 : Comment expliquer que le classement des résultats diffère d'un moteur de recherche à l'autre ?

✍️ Question 4 : Pourquoi les articles pointant vers Wikipédia arrivent-ils souvent bien classés ?

✍️ Question 5 : Comment font les entreprises pour que leur page arrive en haut de classement en tant qu'annonce publicitaire ? Pourquoi font-elles cela ?

✍️ Question 6 : En observant les pages d'accueil des moteurs de recherche Qwant et DuckDuckGo, expliquez quelle est leur principale différence avec le moteur de recherche Google.

L'algorithme PageRank de Google

logo de Google

La petite histoire de Google

Source diaporama : https://info-mounier.fr/snt/web/data/Google_PageRank.pdf

Calculer la popularité d'une page avec PageRank

L'algorithme PageRank est un algorithme permettant de calculer la popularité des pages Web afin de classer les pages de réponses avec beaucoup de pertinence. Dans cette partie, vous allez exécuter cet algorithme à la main.

Ce n'est qu'un des algorithmes parmi l'ensemble de ceux utilisés par Google pour classer les pages, mais sans doute celui qui a fait de Google le moteur de recherche qu'il est devenu.

On suppose qu'un moteur de recherche a enregistré 6 pages web. Voici le schéma représentant ces 6 pages ainsi que les hyperliens entre elles symbolisés par des flèches.

graphe de l'exercice

Ainsi, la page A possède un hyperlien vers la page E, la page B possède deux hyperliens sortants vers les pages A et E, etc.

Les règles du jeu pour exécuter l'algorithme PageRank sont très simples :

  • On met un pion sur une page au départ.
  • On choisit au hasard une destination parmi les hyperliens sortants de cette page.
  • On recommence le point précédent à partir de la page atteinte, et ainsi de suite

✍️ Question 7 : On suppose que pour simuler le choix au hasard parmi les destinations possibles on dispose d'une pièce de monnaie, on ne peut donc que tirer à pile ou face. Proposez un moyen de simuler, avec la pièce de monnaie, le choix de la page à visiter si on se trouve sur chacune des 6 pages web.

✍️ Question 8 : Utilisez le site http://pileouface.org/ pour tirer à pile ou face et parcourir 20 pages en tout selon les règles du jeu. Vous comptabiliserez le nombre de fois que chaque page a été visitée dans un tableau.

Page A B C D E F
Nombre de visites (perso)

✍️ Question 9 : Complétez le tableau partagé sur l'Espace Numérique de Travail avec vos valeurs pour mettre tous les résultats en commun. Nous calculerons le score de chaque page en faisant la somme des nombres de visites obtenus, scores que vous consignerez dans le tableau ci-dessous :

Page A B C D E F
Nombre de visites (classe)

✍️ Question 10 : Vérifiez que les pourcentages obtenus par la classe sont proches de :

Page A B C D E F
Pourcentage (score) 15 % 10 % 10 % 10 % 40 % 15 %

✍️ Question 5 : Quelle est la page la plus populaire ?

Programmer PageRank avec Python

Cette activité est à faire sur Capytale en utilisant le code ou le lien fourni par le professeur.

Pour les élèves n'ayant pas accès à Capytale, il suffit de cliquer sur le lien suivant qui permet une ouverture avec Basthon : ouvrir avec Basthon.


Références


Les enseignants de SNT du lycée Emmanuel Mounier, ANGERS Licence Creative Commons

Fichiers à télécharger

Voir en ligne : info-mounier.fr/snt/web/moteurs-de-recherche.php