Référencement, Design et Cie

Attention ce blog a déménagé et est en lecture seule. Cliquez ici pour accéder à Référencement Design et Cie 2.0

Aller au contenu | Aller au menu | Aller à la recherche © Sébastien Billard

19/12/2007

Une interview de Matt Cutts avec quelques informations intéressantes

Dans une interview accordée à Stephan Spencer, Matt Cutts laisse filtrer quelques informations sur les méthode employées par Google et tord le cou à plusieurs mythes. Résumé des points les plus intéressants :

  • Le PageRank est bien l'un des indicateurs employé par Google pour determiner quelle version d'un contenu dupliqué en plusieurs endroits est la version originale.
  • Il existe encore quelques moyens non documentés d'identifier les pages en résultats complémentaires, mais la distinction entre les deux index n'a plus vraiment de sens aujourd'hui.
  • Concernant l'indexation du contenu des fichiers Flash, Google utilisait originellement un parser développé en interne, mais utiliserait désormais le SDK fourni par Adobe.
  • Les liens issus des sites sociaux de mise en favori type del.icio.us ne sont aucunement dépreciés. Un lien est un lien, sauf usage éventuel de l'attribut nofollow.
  • Les liens issus de domaines en .edu ou .gov ne se voient pas reconnaître un poids plus fort du seul fait de leur extension. Par contre Matt Cutts laisse entendre que d'autres signaux seraient transmis via les liens, qui seraient basés sur la qualité et la confiance.
  • La vision "100% algorithmique" du moteur dans le passé était justifiée par le fait que Google disposait alors de peu de moyens humains. Matt Cutts pense aujourd'hui que l'intervention humaine peut être bénéfique, à condition d'être extensible ("scalable") et fiable .
  • L'achat de lien est efficace ! Matt Cutts explique en fait que la tactique consistant à acheter des liens vers ses concurrents pour ensuite les dénoncer risque d'aider ces derniers plutôt que de les handicaper.

12/12/2007

Des recherches plus discrètes avec AskEraser

La débat sur la confidentialité des données personnelles collectées par les moteurs de recherche est une question récurrente. L'Union Européenne, via le Groupe de travail Article 29 sur la protection des données avait par exemple interrogé l'été dernier les moteurs à ce sujet. La réponse de Google à l'époque avait été de rendre anonymes les données collectées au bout de 18 mois (PDF).

Aujourd'hui, Ask va plus loin en lançant AskEraser, une fonctionnalité permettant aux utilisateurs d'effacer toutes les traces de leur activités de recherche sur le moteur, à savoir les termes recherchés, les sites visités, l'adresse IP ainsi que les identifiants de session associés aux recherches.

La furtivité n'est toutefois pas totale :

  • Les données ne sont effacées qu'à partir du moment où AskEraser est activé (on ne peut effacer son activité passée).
  • L'activité de l'utilisateur est conservée quelques heures, pour des raisons techniques.
  • En cas de comportements anormaux, l'activité de l'utilisateur peut être conservée un peu plus longtemps afin de résoudre les problèmes.
  • Ask est tenu de se conformer aux legislations des états, qui peuvent exiger du moteur de conserver certaines données.

AskEraser constitue néanmoins un progrès indéniable. On peut par contre regretter que cette fonctionnalité ne soit accessible qu'aux USA et au Royaume-Uni, et non dans des pays où la question est autrement plus sensible (la Chine, par exemple).

11/12/2007

Les balises <meta> réellement utilisées par Google

Dans un récent billet sur le blog Google Webmaster Central, John Mueller revient sur l'usage fait par Google des balises <meta>. Certes, ces balises ont depuis longtemps perdu de leur importance en matière de positionnement. Cela dit, elle participent néanmoins à la qualification de l'information, et c'est à ma connaissance la première fois qu'un Googler s'exprime sur le sujet.

Qu'en est-il donc ? John Mueller confirme que la balise meta "description" est bien utilisée par Google. Questionné dans les commentaires à propos de la balise meta "keywords", John Mueller indique par contre que celle-ci n'est généralement pas utilisée, mais que l'on est libre de l'insérer si on en a l'usage.

Concernant la balise meta "language" et l'attribut "lang", John Mueller explique qu'ils ne sont pas pris en compte pour déterminer la langue d'un document.

A lire également sur le sujet : Le point sur les balises meta.