Référencement, Design et Cie

Attention ce blog a déménagé et est en lecture seule. Cliquez ici pour accéder à Référencement Design et Cie 2.0

Aller au contenu | Aller au menu | Aller à la recherche © Sébastien Billard

18/09/2007

Google laisse filtrer des informations confidentielles sur Google Reader

A lire sur le blog de Frédéric Cozic, une traduction en français des propos tenus lors d'une réunion interne des équipes en charge de Google Reader, publiée par erreur sur Google Vidéo, puis retirée.

On y apprend notamment que parmi les 8 millions de flux indexés, 2/3 n'ont qu'un seul lecteur, que ces flux sont mis à jour au minimum toutes les 3h, que le volume de données indexé dépasse 10 terabytes, que Google Reader est la troisième application la plus fréquentée après Gmail et Orkut... et plein d'autres choses.

Google blackliste Wikipedia !

L'information est toute fraîche : Google vient de bannir Wikipedia de ses pages de résultats. Pour preuve, la commande "site:", qui retourne normalement l'ensemble des pages indexées d'un site donné, n'affiche plus aucune page de l'encyclopédie collaborative.

Rassurez-vous, il s'agit d'une blague, découverte semble-t-il par John Honeck, basée sur l'utilisation du paramètre "&num=0". Ne soyez donc pas étonné si quelque plaisantin (ou quelque société malhonnête) vous informe que votre site est blacklisté ;)

14/09/2007

Optimiser le référencement des fichiers PDF

Dans un article intitulé "Eleven tips for optimizing PDFs for search engines", Galen DeYoung propose 11 astuces pour mieux référencer les fichiers Acrobat. Résumé rapide :

  • Assurez vous que les textes de vos PDFs soient bien du texte, et non du texte vectorisé ou dans un format bitmap.
  • Renseignez les propriétés des documents, qui sont au fichiers Acrobat ce que les balises <title> et <meta> sont aux documents HTML, en particulier la propriété "title".
  • Travaillez la teneur de votre contenu, tout comme vous le feriez avec une page web.
  • Incluez des liens vers votre site dans vos documents, en veillant à utiliser des intitulés de liens pertinents.
  • Faites attention aux versions de format, les moteurs pouvant ne pas être compatibles avec les dernières versions d'Acrobat. Préférez le format Acrobat 7 au format Acrobat 8.
  • Veillez à garder une taille de fichier raisonnable. Si vos fichiers sont trop volumineux, tout leur contenu ne sera pas indexé.
  • Arrangez-vous pour que vos PDFs soient trouvés facilement par les moteurs, en les positionnant dans le haut dans votre arborescence.
  • Influencez la description de vos PDFs dans les pages de résultats, en faisant en sorte de placer du texte pertinent dès le début des documents (technique de "front loading").
  • Spécifiez l'ordre de lecture des éléments composant votre PDF, en utilisant les fonctions d'accessibilité d'Acrobat.
  • Taggez vos PDFs, toujours grâce aux options d'accessibilité. Definissez titres et textes alternatifs pour les images.
  • Soyez attentifs, en vérifiant l'ensemble de ces points à chaque édition de vos PDFs.

A lire également sur le sujet : cet article de WebAIM sur l'accessibilité des fichiers PDF (en anglais).

Google Webmaster Tools comptabilise vos abonnés RSS

L'interface de Google Webmaster Tools vient d'être refondue, et s'accompagne d'une nouvelle fonctionnalité : désormais, une rubrique "statistiques relatives aux abonnés" affiche le nombre d'abonnés aux différents flux RSS et Atom publiés par le site. Seuls les abonnés utilisant les services Google (iGoogle, Google Reader, Orkut) sont comptabilisés, mais cela permet d'avoir une première idée de son audience lorsque on n'utilise pas Feedburner.

Rappelons qu'il est aussi possible de connaître son nombre d'abonnés Bloglines en faisant une recherche sur le titre du blog avec l'option "Rechercher des flux".

Les flux de Référencement Design et Cie comptent ainsi 639 abonnés Google et 195 abonnés Bloglines. Merci de votre fidélité :)

6/09/2007

Des internautes sous l'influence des moteurs

A en croire les résultats d'une étude menée par un groupe de chercheurs de l'université de Cornell et de la faculté de Charleston, les internautes accorderaient une confiance trop grande aux pages de résultats des moteurs de recherche, en particulier Google.

Si l'on sait déjà depuis longtemps que ce sont les sites les mieux positionnés qui recueillent le plus de clics (c'est le fameux "triangle d'or"), on ignorait jusque ici si ces clics étaient motivés par la seule position de liens, par la pertinence perçue des sites basée sur la description du lien, ou par une combinaison de ces deux paramètres. Il apparaît finalement que le positionnement des liens introduit un bias significatif dans la décision de cliquer. Ainsi, nombre de liens jugés à priori moins pertinents seraient quand même cliqués parce que bien positionnés.

24/08/2007

Le référencement est un sport

Certains comparent le référencement à de l'athlétisme, d'autres à de la formule 1. Faux ! Si le référencement ressemble à un sport, c'est davantage à la pétanque : il faut en effet s'approcher le plus près possible du cochonnet (la première place), en envoyant éventuellement bouler les autres ! Google ne s'y est pas trompé d'ailleurs... ;)

22/08/2007

Contrôlez votre positionnement dans les moteurs de recherche avec Agent Web Ranking

Les lecteurs les plus attentifs l'auront peut-être remarqué, ce blog affiche depuis quelques semaines une rubrique "Partenaires" comportant un lien vers le site Agent Web Ranking (AWR pour les intimes).

Pourquoi ? Outre le fait qu'il s'agit d'un partenariat, je suis avant tout un utilisateur satisfait de ce logiciel de suivi de positionnement, et ce depuis de nombreuses années. Je me souviens, non sans une certaine nostalgie, de cette présentation par Fabien et Antoine, suivie d'un déjeuner autour d'une pizza. Je me revois, jeune référenceur plein de fougue, me livrant à des sessions de chat endiablées lors des tests de versions bêta... (normalement, à ce point du billet, vous devriez avoir la larme à l'oeil et entendre les violons)

Plus sérieusement, Agent Web Ranking sert essentiellement à faire du contrôle de positionnement, mais il le fait bien. D'autres solutions existent, comme Yooda SeeUrank, mais c'est AWR qui garde personnellement ma préférence. L'interface, particulièrement claire, est très vite maîtrisée : on renseigne les URLS et les mots-clés à auditer, on sélectionne les moteurs à auditer et le logiciel se charge du reste ! Etant donné qu'Agent Web Ranking garde en mémoire les positions relevées, il est très facile de suivre l'évolution du positionnement d'un site dans le temps. Et parce qu'on ne peut se passer de reporting, Agent Web Ranking propose d'exporter les données collectés au format HTML ou CSV.

Un autre point fort de la solution AWR est la réactivité de ses développeurs : les moteurs changeant régulièrement leurs pages de résultats, il est primordial de maintenir à jour ce type de logiciels. Agent Web Ranking garantie la prise en compte de ces modifications dans un délai maximum de 72 heures. Mais cela est fait bien plus rapidement en général :)

Je pourrais encore dire bien des choses sur ce logiciel, mais le mieux est encore de le tester vous-même : profitez-en, une version pleinement fonctionnelle pendant 15 jours est disponible sur le site.

8/08/2007

Optimiser son profil Linkedin

C'est un fait, Linkedin et les sites de networking professionnel sont de plus en plus utilisés à des fins de recrutement. Dès lors, il devient important de s'assurer d'être trouvé facilement.

Disposant d'un peu plus de temps en ce mois d'aout, je me suis livré avec mes collègues à un peu d'ingénierie inverse sur Linkedin. L'étude du moteur est assez simple, puisque ses résultats sont mis à jour en temps réel, ce qui facilite les tests. Le moteur de recherche Linkedin s'avère finalement des plus basique : ce sont en fait les profils affichant le plus grand nombre d'occurences de l'expression recherchée qui ressortent en premier, avec un poids semble-t-il légèrement plus fort donné au nom du profil. Pour être visible sur une expression donnée, il suffit donc d'employer celle-ci un peu plus que ses concurrents. Et ça marche ;)

7/08/2007

Que trouve-t-on dans la tête d'un référenceur ?

Ce blog bénéficiant d'une certaine visibilité, je reçois plus ou moins régulièrement des emails de webmasters ou d'étudiants me questionnant sur les compétences à posséder pour devenir référenceur. Ma réponse, plutôt synthétique, ressemble en général à ça.

L'idée d'un inventaire plus poussé des connaissances liés au métier a cependant fait son chemin, et après quelques heures d'intense introspection, je suis finalement arrivé à ceci (nécessite le plugin Flash).

Cette carte heuristique (ou mindmap) a été crée à l'aide du logiciel Freemind. Pour déplacer la carte, cliquez simplement et faites glisser votre souris. Pour zoomer ou dezoomer, utilisez la molette. Les flèches rouges indiquent un lien externe relatif à l'élément séléctionné. Il vous est également possible de réduire ou développer les branches en cliquant sur les noeuds.

(Note : dans Internet Explorer, le focus tend à rester sur le lien cliqué, ce qui fait que la carte "colle" au curseur. Si c'est le cas, jouez avec le zoom via la molette et cliquez sur une zone vide)

2/08/2007

Google abandonne la mention "résultat complémentaire"

J'évoquais il y a deux jours une nouvelle syntaxe pour identifier les pages en résultats complémentaires. Il se pourrait bien que cette syntaxe devienne obsolète à son tour : Google vient en effet d'annoncer sur son blog que la distinction entre les pages issues de l'index principal et celles issues de l'index complémentaire était de plus en plus ténue, et qu'en conséquence l'affichage de la mention "résultats complémentaires" n'avait plus raison d'être.

Apparus en 2003, les résultats complémentaires concernaient à l'origine des pages à faible PagRank, ou possédant des URLs complexes. Ces pages constituaient un index de secours dans lequel Google allait chercher pour les requêtes générant peu de résultats. Avec l'amélioration de son infrastructure, la fraîcheur, la qualité et la taille de l'index complémentaire se sont grandement améliorés, d'où la décision d'abandonner la mention "résultat complémentaire". Matt Cutts avait d'ailleurs sous-entendu dès janvier 2007 cette évolution en commentaire d'un de ses billets : "a page that’s a supplemental result now may well get more traffic in the future than it gets right now. Personally, I am a fan of dropping the label supplemental results".

31/07/2007

10 preuves que Google est bien Dieu

Alors que certains s'interrogent encore, ces dix arguments imparables vous prouveront que Google est véritablement Dieu :

30/07/2007

Résultats complémentaires Google : nouvelle syntaxe

La disparition début juillet de la syntaxe "site:www.exemple.com *** -khjd" qui permettait jusqu'ici d'identifier les pages d'un site considérées comme résultats complémentaires avait ému la communauté des référenceurs, qui considéraient cette fonctionnalité utile pour évaluer la bonne santé d'un site.

Qu'importe, une nouvelle syntaxe a été découverte sur Webmaster World : désormais, la syntaxe a utiliser est "site:www.exemple.com/&".

20/07/2007

Où trouver des statistiques sur les moteurs de recherche et le référencement ?

La recherche de statistiques sur le marché des moteurs et le search marketing en général est un sujet qui revient plus ou moins régulièrement sur les forums traitant de référencement. Voici une revue rapide des principales sources d'information...

En France, le baromètre S2M, fruit de la collaboration entre 1ère Position et Xiti, fait référence en ce qui concerne les parts de marché des moteurs et leurs évolutions. Le site Xiti Monitor quant à lui fournit des données plus globales sur les usages du web. Ad'oc propose également son baromètre, basé sur l'analyse du trafic des clients de la société. La part de trafic issu des moteurs y est analysée, ainsi que la typologie des requêtes utilisateurs (nombre de mots, influence de la marque). Enfin, la lettre d'information INSEE Première est également une source de qualité sur les usages d'internet en France. Les données (PDF) issues de l'enquête "Technologies de l'information et de la communication" sont particulièrement intéressantes.

A l'international, Comscore est une des sources les plus connues, et ne se limite pas aux seuls moteurs de recherche. Hitwise publie également un "top" des outils de recherche US, ainsi que des analyses régulières via les blogs de ses experts. Le site Market Share se base lui sur un panel mondial et permet de personnaliser les graphiques.

Si l'on cherche des "papiers" plutôt que des tendances, OneStat et iProspect sont de bonnes sources. OneStat, service de mesure d'audience, fournit régulièrement des données sur l'utilisation des moteurs. iProspect a lui une approche plus marketing.

18/07/2007

Google : aussitôt publié, aussitôt indexé

Décidément il semble que l'indexation dans Google approche de plus en plus le temps réel... Olivier Andrieu s'en faisait d'ailleurs l'écho récemment. Le contenu de mon précédent billet sur l'offre Custom Search Business Edition, affiché en page d'accueil, s'est ainsi vu indexé en moins de 3 heures ! Impressionnant...

PS : Ce présent post vient de se faire indexer en moins de 30 minutes...

PS 2 : A lire également sur le sujet, le billet de 1ère Position.

Google Custom Search Business Edition, un moteur de recherche en mode ASP

Annoncée hier sur le blog officiel de la société, l'offre Custom Search Business Edition (CSBE) de Google permet aux entreprises de créer leurs propres moteurs et d'offrir ainsi une recherche de qualité à leurs visiteurs.

Le produit n'a rien de révolutionnaire : Les CSBE ne sont en fait que la version premium des Custom Search Engine (CSE), et fonctionnent de la même façon. Le paiement d'une somme annuelle forfaitaire (à partir de 100$ jusque 5000 pages) permet d'accéder à un support technique par email et par téléphone, à des possibilité de personnalisation plus poussées via une API XML et à des pages de résultats dénuées de publicité.

Utilisant l'index web de Google, les CSBE (tout comme les CSE) n'indexent cependant pas les pages à la demande : pour ce type d'application, mieux vaut se tourner vers Google Mini (1995€) ou Search Appliance.

< 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 >