Référencement, Design et Cie

Attention ce blog a déménagé et est en lecture seule. Cliquez ici pour accéder à Référencement Design et Cie 2.0

Aller au contenu | Aller au menu | Aller à la recherche © Sébastien Billard

27/09/2007

"Engooglés", une fiction cauchemardo-googlesque

Les éditions C&F viennent de mettre en ligne "Engooglés", la traduction française de la nouvelle d'anticipation de Cory Doctorow, "Scroogled". On y découvre un Google à la solde du gouvernement US, scrutant les moindres faits et gestes des citoyens. Il ne s'agit bien sûr que d'une fiction. Mais on se surprend quand même à penser que tout cela est techniquement de l'ordre du possible...

Google fait aussi la chasse aux liens artificiels en France

On le répète pourtant depuis longtemps : la création de liens artificiels ou de mauvaise qualité n'est pas une solution pérenne en matière de référencement. Dernièrement, Google pénalisait ainsi manuellement un certain nombre d'annuaire américains présentant des signes manifestes de mauvaise qualité, comme la présence de liens douteux, un discours trop axé sur la transmission de PageRank, la possibilité de liens multiples avec choix des ancres, ou encore l'obligation de lien reciproques.

On pourrait se croire à l'abri de telles sanctions en France. Ce n'est pas le cas : le réseau d'échange automatique de liens Refseo vient semble-t-il de se faire pénaliser par Google. Tout commes les annuaires évoqués plus haut, le site n'est plus trouvable ni sur sa marque, ni sur le contenu de sa balise title, mais uniquement sur son nom de domaine. On peut également penser que le site Refseo a perdu toute capacité à transmettre du PageRank, même s'il affiche toujours un PR de 6 (ce qui confirme encore une fois qu'il ne faut pas faire aveuglément confiance au PageRank affiché par la Googlebar).

Le site Refseo n'est pas le seul touché : un certain nombre de membres du réseau ont également fait l'objet d'une pénalité temporaire de 30 jours, accompagnée d'un email d'avertissement expliquant que la présence de textes et de liens cachés sur leur site n'était pas conforme aux directives de qualité du moteur.

25/09/2007

Une autre preuve de la non-relation entre Sitelinks et TrustRank

En avril dernier, je tentais de décrypter le fonctionnement des Sitelinks Google, en exprimant mon scepticisme vis-à-vis de la relation pourtant souvent évoquée entre Sitelinks et Trustrank.

Un récent article de Rand Fishkin sur le blog SEOmoz semble conforter cette absence de relation : Rand observe ainsi qu'un certain nombre d'annuaires pénalisés par Google (mais non blacklistés) continuent d'afficher des Sitelinks lors d'une recherche sur leur nom de domaine. La notion de "confiance" ("trust" en anglais) n'est donc vraisemblablement pas une condition préalable à l'affichage des Sitelinks.

18/09/2007

Google laisse filtrer des informations confidentielles sur Google Reader

A lire sur le blog de Frédéric Cozic, une traduction en français des propos tenus lors d'une réunion interne des équipes en charge de Google Reader, publiée par erreur sur Google Vidéo, puis retirée.

On y apprend notamment que parmi les 8 millions de flux indexés, 2/3 n'ont qu'un seul lecteur, que ces flux sont mis à jour au minimum toutes les 3h, que le volume de données indexé dépasse 10 terabytes, que Google Reader est la troisième application la plus fréquentée après Gmail et Orkut... et plein d'autres choses.

Google blackliste Wikipedia !

L'information est toute fraîche : Google vient de bannir Wikipedia de ses pages de résultats. Pour preuve, la commande "site:", qui retourne normalement l'ensemble des pages indexées d'un site donné, n'affiche plus aucune page de l'encyclopédie collaborative.

Rassurez-vous, il s'agit d'une blague, découverte semble-t-il par John Honeck, basée sur l'utilisation du paramètre "&num=0". Ne soyez donc pas étonné si quelque plaisantin (ou quelque société malhonnête) vous informe que votre site est blacklisté ;)

14/09/2007

Optimiser le référencement des fichiers PDF

Dans un article intitulé "Eleven tips for optimizing PDFs for search engines", Galen DeYoung propose 11 astuces pour mieux référencer les fichiers Acrobat. Résumé rapide :

  • Assurez vous que les textes de vos PDFs soient bien du texte, et non du texte vectorisé ou dans un format bitmap.
  • Renseignez les propriétés des documents, qui sont au fichiers Acrobat ce que les balises <title> et <meta> sont aux documents HTML, en particulier la propriété "title".
  • Travaillez la teneur de votre contenu, tout comme vous le feriez avec une page web.
  • Incluez des liens vers votre site dans vos documents, en veillant à utiliser des intitulés de liens pertinents.
  • Faites attention aux versions de format, les moteurs pouvant ne pas être compatibles avec les dernières versions d'Acrobat. Préférez le format Acrobat 7 au format Acrobat 8.
  • Veillez à garder une taille de fichier raisonnable. Si vos fichiers sont trop volumineux, tout leur contenu ne sera pas indexé.
  • Arrangez-vous pour que vos PDFs soient trouvés facilement par les moteurs, en les positionnant dans le haut dans votre arborescence.
  • Influencez la description de vos PDFs dans les pages de résultats, en faisant en sorte de placer du texte pertinent dès le début des documents (technique de "front loading").
  • Spécifiez l'ordre de lecture des éléments composant votre PDF, en utilisant les fonctions d'accessibilité d'Acrobat.
  • Taggez vos PDFs, toujours grâce aux options d'accessibilité. Definissez titres et textes alternatifs pour les images.
  • Soyez attentifs, en vérifiant l'ensemble de ces points à chaque édition de vos PDFs.

A lire également sur le sujet : cet article de WebAIM sur l'accessibilité des fichiers PDF (en anglais).

Google Webmaster Tools comptabilise vos abonnés RSS

L'interface de Google Webmaster Tools vient d'être refondue, et s'accompagne d'une nouvelle fonctionnalité : désormais, une rubrique "statistiques relatives aux abonnés" affiche le nombre d'abonnés aux différents flux RSS et Atom publiés par le site. Seuls les abonnés utilisant les services Google (iGoogle, Google Reader, Orkut) sont comptabilisés, mais cela permet d'avoir une première idée de son audience lorsque on n'utilise pas Feedburner.

Rappelons qu'il est aussi possible de connaître son nombre d'abonnés Bloglines en faisant une recherche sur le titre du blog avec l'option "Rechercher des flux".

Les flux de Référencement Design et Cie comptent ainsi 639 abonnés Google et 195 abonnés Bloglines. Merci de votre fidélité :)

6/09/2007

Des internautes sous l'influence des moteurs

A en croire les résultats d'une étude menée par un groupe de chercheurs de l'université de Cornell et de la faculté de Charleston, les internautes accorderaient une confiance trop grande aux pages de résultats des moteurs de recherche, en particulier Google.

Si l'on sait déjà depuis longtemps que ce sont les sites les mieux positionnés qui recueillent le plus de clics (c'est le fameux "triangle d'or"), on ignorait jusque ici si ces clics étaient motivés par la seule position de liens, par la pertinence perçue des sites basée sur la description du lien, ou par une combinaison de ces deux paramètres. Il apparaît finalement que le positionnement des liens introduit un bias significatif dans la décision de cliquer. Ainsi, nombre de liens jugés à priori moins pertinents seraient quand même cliqués parce que bien positionnés.