Les brevets déposés par les moteurs de recherche constituent une source d'information très intéressante pour qui s'intéresse au référencement. Même si le simple dépôt de brevets ne signifie pas leur mise en oeuvre effective, leur lecture permet de mieux cerner les méthodes employées par les moteurs de recherche.

Dans son dernier billet, Olivier Duffez décortique un brevet attribué à Google en décembre 2007, intitulé "Anchor tag indexing in a web crawler system" (ce brevet est également commenté par Bill Slawski).

Si Olivier s'est surtout intéressé à la description du système de crawl, l'information la plus intéressante reste pour moi le fait que le texte entourant un lien est utilisé comme un signal dans l'évaluation de la pertinence de la page de destination par rapport à une requête donnée.

La quantité de texte retenue par le moteur utilise principalement la notion de distance par rapport à l'ancre du lien : le texte situé à x caractères à droite et à gauche du lien sera ainsi utilisé. Mais cette distance peut être modulée en fonction des autres ancres de liens à proximité, de la quantité de texte totale du document ainsi que d'autres critères.

Il y a donc tout intérêt, aussi bien pour l'utilisateur que pour les moteurs, à placer des liens au sein même des contenus, et à ne pas réserver ceux-ci aux seuls éléments de navigation. Ces liens seront fortement porteurs de pertinence, puisque non seulement leur ancre sera prise en compte, mais probablement aussi le texte attenant (d'ailleurs c'est déjà le cas avec Google Images).

Cette forme d'écriture, si elle est courante dans la blogosphère, reste encore trop rare sur le reste du web...