Apparus pour la première fois sur Google en juillet 2005, les Sitelinks sont des liens additionnels affichés en dessous de la description de certains sites lorsqu'ils apparaissent en première position, pour certaines requêtes (ex : recherche sur "Webmaster Hub").

Ces liens permettant au site de se distinguer, il m'a semblé intéressant de tenter de comprendre leur fonctionnement, et éventuellement de proposer des pistes pour les faire apparaître et les optimiser.

Ce qu'en dit Google

"Ces liens sont appelés Sitelinks. Si par exemple vous effectuez une recherche sur Stanford, le premier résultat contient des liens vers d'autres pages du même site, sous le résultat de recherche habituel. Cette fonctionnalité Sitelinks propose des liens vers les pages intérieures des sites qui sont susceptibles d'intéresser les utilisateurs. Les liens étant générés automatiquement, nous ne sommes pas en mesure de les ajouter manuellement pour des sites spécifiques de notre index ou de modifier les liens qui apparaissent".

Quand les Sitelinks s'affichent-ils ?

La rumeur veut que l'affichage des Sitelinks soit la marque du Trustrank. Cette hypothèse n'a cependant pas de fondement valable, puisque l'on ne dispose d'aucun moyen pour connaître le Trustrank d'un site. Et le fait que certains sites X affichent des Sitelinks fait fortement douter de l'influence du "trust" en ce qui concerne les Sitelinks...

Ce que l'on observe, c'est que les Sitelinks s'affichent uniquement quand le site est premier sur la requête, et quand celui-ci est considéré de façon quasi certaine par Google comme le site recherché pour cette requête. Les recherches sur les noms de marques sont donc celles qui affichent le plus fréquemment des Sitelinks, sauf lorsque le nom de la marque est ambigu, par exemple "Apple". Dans de rares cas, certains sites affichent de Sitelinks sur des requêtes génériques lorsqu'ils bénéficient de nombreux liens ayant pour intitulé la requête (ex : glaces.org pour la requête "sorbet").

Une observation attentive des Sitelinks et l'étude du brevet décrivant le système laissent à penser que l'affichage des Sitelinks est lié au comportement des utilisateurs, à la fois sur les pages de résultats Google, et sur le site. Un trafic suffisant est donc nécessaire pour obtenir les Sitelinks. Par contre, le PageRank ne semble pas intervenir.

Le nombre de Sitelinks affiché n'est pas fixe : le nombre de liens affichés peut varier entre 3 et 4 (on a plus rarement parfois observé 2 liens).

Quelles URLs sont choisies ?

Google affirme afficher les URLs "les plus susceptibles d'intéresser l'utilisateur". Comme dit plus haut, cet intérêt de l'utilisateur est estimé en fonction de l'interaction de celui-ci avec le site et avec les pages de résultats Google. Il en découle que les Sitelinks affichés sont ceux qui reçoivent un grand nombre de visites : ce peuvent être les pages les plus fréquemment accédées sur le site, comme celles les plus cliquées à partir des pages de résultats, car très bien référencées (ex : Darty). On observe également que les clics sur les Sitelinks sont systématiquement trackés : il est donc probable que ceux-ci s'affinent avec le temps.

Les liens retenus n'ont pas forcément à être accessibles directement à partir de la page d'accueil des sites, il peut s'agir de pages profondes, mais populaires (ex : le Sitelink "Noms de domaine et hébergement" de Webmaster Hub). Il peut également s'agir de sous-domaines du domaine principal (ex : Sitelinks du Parti Socialiste).

Quels intitulés pour les Sitelinks ?

L'intitulé des Sitelinks reprend le plus souvent le texte des liens, la balise <title> de la page, parfois l'attribut alt des liens image (ex : Sitelink "Le FN" du site du Front National). Dans tous les cas, le texte des Sitelinks ne dépasse jamais les 35 caractères. La reprise des intitulés des liens et des <title> n'est pas forcément intégrale : il semblerait que Google filtre parfois les noms de marques des intitulés et les textes génériques, peut-être par un système de reconnaissance des entités nommées (ex : Speedy avec le Sitelink "Pneu").

Le choix de Google de reprendre soit le texte des liens, soit la balise <title> n'est pas bien clair : peut-être Google estime-t-il que l'un des deux est plus descriptif, en se basant sur le contenu. Une autre hypothèse est que Google se base sur l'origine des clics pour déterminer quel titre adopter : un plus grand nombre de clics via les pages de résultats pourrait favoriser la reprise de la balise <title> puisque c'est cette balise qui est utilisée comme lien dans les pages de résultats, et qui motive généralement les clics des utilisateurs. Ceci n'est qu'une hypothèse.

Quelles pistes pour l'optimisation des Sitelinks ?

Le principe de fonctionnement des Sitelinks, fortement basé sur le comportement des utilisateurs, fait qu'il est difficilement envisageable de les contrôler. Mais il est possible de les favoriser, et de les influencer :

  • Arrangez-vous pour être premier sur votre marque et générer un trafic suffisant pour votre site.
  • Utilisez des intitulés de liens courts et explicites. Vous éviterez ainsi les Sitelinks du type "cliquez-ici" ou "valider".
  • Si vous voulez contrôler de façon sûre le texte du Sitelink, utilisez le même texte pour les ancres des liens et pour la balise <title> de la page.
  • Faites en sorte que vos liens stratégiques se démarquent visuellement, afin d'augmenter leur taux de clics et de les transformer en Sitelinks. Optez pour un design persuasif.
  • Si vous faites de l'emailing, utilisez des liens directs vers les pages à promouvoir au lieu de renvoyer sur la page d'accueil, toujours dans le but de créer du trafic sur ces pages.
  • Evitez d'utiliser des technologies qui font obstacle aux moteurs : liens javascript, Flash, etc.

A lire également (en anglais) :

Google's Listings of Internal Site Links for Top Search Results
Traffic Determines Google UI Snippet Links
How Does Google Create Multi Link Listings?