Les moteurs de recherche

"Big Brother is watching You"- Georges orwell

L'indexation


Une fois que le nouveau site ou la nouvelle page a été trouvé par le robobt crawler, le moteur de recherche dois l'indexer à sa base de donnée, c'est à dire garder son emplacement sur ses propres serveurs.

Souvent, comme chez google, c'est le robot crawler qui se charge égalemlent de cette tâche. Lorsque celui-ci déniche un site nouveau ou une nouvelle page, il scan directement son contenu. Ce contenu ainsi que l'adresse de la page son ensuite mémorisés sur la base de données du moteur de recherche afin de permettre une recherche.


Voici ce à quoi ressemble un datacenter, là où sont stockés les bases de donneés

datacenter wikimedia

Sur la base de données du moteur de recherche, chaque page, en fonction de son contenu est associé à plusieurs mots clés représentant les thèmes traités sur la page ainsi que dans certains cas, le nom même du site.

Une fois le site ou la page sur la base de donnée du moteur de recherche, celui-ci va determiner son page rank.

Un petit mot

Ce site a été écrit par Alexandre.B et Maxime.H dans le cadre de notre projet d'ISN pendant les vacances de noël 2014/2015

Nous espérons que notre site vous permettra d'en savoir davantage sur les moteurs de recherches. Nous vous souhaitons une bonne lecture sur nôtre site internet.

Réalisé par Alexandre.B et Maxime.H pour l'ISN.

Toutes les photos de ce site sauf le logo sont libres de droits d'usage ou de distribution.