Revenir
Revenir

Modèle du surfeur aléatoire

Le modèle du surfeur aléatoire décrit la probabilité qu'un utilisateur visite aléatoirement une page...

Sommaire

Le modèle du surfeur aléatoireComment le surfeur aléatoire est devenu raisonnableModèle du surfeur aléatoire - QuestionsModélisation du surfeur aléatoire - Fichier calcPageRank Simulator - Site

Le modèle du surfeur aléatoire

Le modèle du surfeur aléatoire décrit la probabilité qu'un utilisateur visite aléatoirement une page web. Ce modèle tente de prédire la probabilité qu'un internaute atteigne d'une manière aléatoire, c'est-à-dire régie par le hasard, une page en cliquant sur un lien ou en accédant directement à un site web, par exemple en tapant l'URL de celui-ci directement dans la barre d'adresse.
Le surfeur peut être pris au piège dans un groupe de pages liées les unes aux autres, mais fermées au reste du Web. Dans ce cas, il saute au hasard vers un autre site Web. Ce changement soudain peut aussi venir directement du surfeur lui-même qui s'ennuie avec les pages qu'il visite ou qui ne trouve pas ce qu'il cherchait... 
Le PageRank d'une page peut être interprété comme la probabilité que cet internaute surfeur aléatoire se trouve sur cette page à un instant donné. 

Comment le surfeur aléatoire est devenu raisonnable

Pour comprendre le terme PageRank, il est important d'avoir à l'esprit la différence entre les notions de "surfeur aléatoire" et "surfeur raisonnable". À l'origine, Google a accordé un poids égal à tous les liens d'une page, à condition qu'ils aient la même probabilité d'être cliqués : c'est le modèle du "surfeur aléatoire".
En 2010, Google a amélioré son algorithme pour prendre encore plus en compte le comportement réel des internautes sur les sites web. On parle alors du modèle du "surfeur raisonnable". En effet, lorsqu'ils naviguent sur une page, les internautes sont généralement plus susceptibles de cliquer sur des liens en haut de la page ou dans le contenu. Par conséquent, Google considère depuis 2010 ces liens plus importants que les liens en bas (pied de page) de la page ou sur le côté de la page.
Par conséquent, la position du lien et sa contextualisation sont des critères importants pour évaluer sa popularité. 

Modèle du surfeur aléatoire - Questions

1. Modélisez le mini site web composé de quatre pages sous la forme d'un graphe. Que représentent les nœuds et les arêtes ?
2. Effectuez un classement intuitif des pages web qui composent le mini site web.
3. Une autre approche du PageRank consiste à faire parcourir par un "surfeur aléatoire" les pages web qui sont reliées les unes aux autres en respectant les déplacements autorisés. Les déplacements d'une page à l'autre seront simulés par le résultat d'un lancer de dé.
Règles du jeu pour 24 lancers de dé (avec comme point de départ l'un des quatre sommets du graphe modélisant le mini site web.
  • lancez un dé ;
  • si 4 ou 5, lancez le dé à nouveau sans le comptabiliser dans le total des essais ;
  • si 0, 1, 2 ou 3 ajoutez 1 au nombre total d'essais puis se rendre sur la page de destination si le déplacement est autorisé en cochant le numéro de la page visitée sinon lancez le dé à nouveau ; 
  • tant que le nombre total d'essais n'est pas égal à 24, recommencez à la première étape;
a) En suivant les règles du jeu, complétez le tableau du fichier Libreoffice Calc "Surfeur_aleatoire". Le lancer de dé est simulé sur la page du tableur par une fonction aléatoire tirant au hasard un nombre compris ente 0 et 5 à chaque fois que l'on appuie sur la touche F9. Classez les pages de la plus visitée à la moins visitée. 
b) En utilisant l'application en ligne "PageRank simulator" vérifiez si les résultats obtenus précédemment sont cohérents.
c) Comment pourrait-on améliorer la prédictibilité du Page Rank en utilisant la méthode du surfeur aléatoire ? 
4. Quel modèle de surfeur Google utilise-t-il depuis 2010 ? Quelle est la différence avec le modèle du surfeur aléatoire ?

Modélisation du surfeur aléatoire - Fichier calc

NB : pour télécharger le fichier, cliquez sur la flèche qui pointe vers le bas dans les outils grisés à droite.

https://lesmanuelslibres.region-academique-idf.fr/snt-seconde/Le%20Web/Activites/Modele%20du%20surfeur%20aleatoire/./Modelisation du surfeur aleatoire Fichier calc.ods

https://lesmanuelslibres.region-academique-idf.fr/snt-seconde/Le%20Web/Activites/Modele%20du%20surfeur%20aleatoire/./Modelisation du surfeur aleatoire Fichier calc.ods

PageRank Simulator - Site

  • Click Add Page to add a new page.
  • Click and drag a page to move it.
  • Click a page and then click another page to add a link.
  • Click a page or link and then Delete Selected (or press Delete) to remove something.
  • Click Run Page Rank to display rankings.