Le protocole d'exclusion
Le protocole d’exclusion est une ressource insérée à la racine d’un site web. Il se présente sous la forme d’un fichier texte qui liste les contenus ne devant pas être indexés par les robots d’indexation. Le protocole d’exclusion est utilisé afin d’éviter l’indexation de ressources sans intérêt pour l’internaute. De manière concrète, il empêche les robots d’indexation d’accéder à certains contenus. Ainsi, ces derniers n’apparaissent pas dans la page de résultats même s’ils sont visibles sur une page.
Le protocole d’exclusion consiste généralement à utiliser un robots.txt placé à la racine d’un site web. Il s’agit d’un fichier texte comprenant la liste des ressources qui ne doivent pas être indexées par les robots des moteurs de recherche. Cette pratique est fréquemment utilisée lors des opérations d’optimisation de MP6. Ce fichier peut également contenir l’adresse d’un sitemap présenté au format XML et destiné aux moteurs de recherche en fonction des sites. Lorsqu’ils crawlent un site, les robots d’indexation consultent en premier lieu le robots.txt. Ils n’indexent alors que les contenus non listés dans ce protocole.
Le robots.txt
Différents robots
Les autres protocoles d'exclusion
Nous contacter
...