Référencement, Design et Cie

Attention ce blog a déménagé et est en lecture seule. Cliquez ici pour accéder à Référencement Design et Cie 2.0

Aller au contenu | Aller au menu | Aller à la recherche © Sébastien Billard

25/08/2006

Blogbar, le mini moteur qui rapporte

Le multi-moteur de recherche Blogbar vous permet désormais de gagner de l'argent, grâce au programme de liens sponsorisés Adsense.

La Blogbar s'est également enrichie de nouvelles fonctionnalités depuis la présentation que j'en avais faite en novembre dernier, avec notamment la possibilité de recherche sur les réseaux sociaux (Wikio, Fuzz, Del.icio.us...).

22/08/2006

Le référencement en question

Dans un long mais très pertinent article, Stéphane Marec réfléchit sur la définition du mot "référencement". Après avoir passé en revue -et rejeté- plusieurs définitions restrictives ou incomplètes du référencement, Stéphane propose de définir le référencement comme étant "la capacité à proposer une stratégie personnalisée d’acquisition de visibilité et de trafic utile sur les outils de recherche, répondant précisément aux objectifs de communication du client, et à proposer le plan d’action le plus adéquat afin de mettre en œuvre cette stratégie".

Je ne peux qu'aprouver le propos, qui rejoint sur certains points ma tentative de définition du "référenceur 2.0".

3/08/2006

Nouvelle interface en test chez Exalead

Annoncée pour mai, la nouvelle interface d'Exalead, encore en version beta, est enfin accessible au public (mot de passe : beta).

Le moteur a bien pris en compte les critiques liées à la lourdeur de l'interface actuelle : Les pages de résultats, bien qu'affichant désormais des liens sponsorisés Yahoo, sont plus claires, plus légères, et leur utilisation se révèle même étonnament fluide.

Cette cure d'amaigrissement ne s'est pas faite au dépend des fonctionnalités, puisque la possibilité d'affiner sa recherche a été conservée. Un menu à droite affiche ainsi par défaut les termes associés à la requête, et permet en un clic et sans rafraichissement de la page d'accéder à davantage d'options, comme la langue des documents, le format des fichiers, la géolocalisation, la recherche de contenu audio, vidéo et XML. Les options de recherche phonétique et en orthographe approchée ont cependant disparu du menu et ne sont accessibles qu'à partir de la recherche avancée, ou via les opérateurs "soundlike:" et "spellslike:", ce qui est à mon avis regrettable, cette fonctionnalité étant pour moi un point fort d'Exalead.

La recherche d'images représentant un usage important des moteurs de recherche, Exalead s'est également doté d'une telle fonctionnalité. Celle-ci, très pratique, permet de naviguer au sein des résultats et de visualiser les images dans leur contexte. Il est également possible de spécifier la taille des images, leur palette (couleur, niveaux de gris, noir et blanc), l'orientation des images (portrait ou paysage), et le format de fichier.

Quelques petites choses que j'aurais apprécié : la possibilité de redimensionner les polices pour plus d'accessibilité, et le fait qu'enfin les visiteurs d'Exalead apparaissent dans les referers, afin d'avoir une meilleure idée du trafic que celui-ci génère...

25/07/2006

Optimiser sa soumission aux annuaires

La soumission aux annuaires représente un élément incontournable d'une campagne de référencement réussie : les liens générés participent non seulement à votre popularité auprès des moteurs, mais génèrent également du trafic direct, souvent de bonne qualité.

En tant que référenceur, je suis bien placé pour savoir que ce processus prends du temps. En tant qu'éditeur de quelques petits annuaires (, et ), je suis aussi bien placé pour savoir que les soumissions sont souvent baclées, quand elles ne sont pas carrément hors-sujet : plus des 3/4 des soumissions que je reçois partent ainsi à la poubelle. Aussi voici quelques conseils pour des soumissions efficaces :

Soignez votre site : quel intérêt pour un éditeur d'annuaire un tant soit peu sérieux de référencer des sites non-finis, qui ne fonctionnent pas, ou affichent cinq popups ? Un annuaire digne de ce nom n'est pas une ferme de liens, mais une collection de ressources. Aussi posez vous la question de savoir si votre site apporte une valeur ajoutée pour les utilisateurs de l'annuaire.

Ciblez vos soumissions : inutile de soumettre le site de votre riad à Marrakech à un annuaire se spécialisant dans les sites de la région Nord-Pas de Calais, vous perdez votre temps et en faites perdre aux éditeurs de l'annuaire. De même, faites gagner du temps aux éditeurs en faisant l'effort de soumettre votre site dans la catégorie la plus pertinente de l'annuaire, et non à sa racine. Ayez toujours en tête que plus vous facilitez le travail des éditeurs, plus votre site aura des chances d'être accepté.

Soignez vos titres et descriptions : rien n'est plus pénible pour un éditeur que d'avoir à réécrire un titre ou une description. Evitez les mots-clés dans le titre, qui ne devrait reprendre que le nom du site. Rédigez une vraie phrase de présentation du site avec sujet, verbe et complément, non une suite de mots-clés. Evitez les superlatifs ("le meilleur site") et les incitations à visiter le site. Décrivez simplement votre site, son contenu, sa spécificité, ses fonctionnalités. Veillez à utiliser une orthographe et un français corrects. Et relisez-vous avant de valider votre soumission : il serait dommage de fournir une URL erronée...

23/06/2006

Blogs et référencement sur le Journal du Net

A lire sur le Journal du Net, un article sur le référencement des blogs : "Le blog : chouchou des moteurs de recherche ?".

Pour les personnes interessées par le sujet, le support de la présentation que j'avais faite à W3 Campus sur le sujet reste disponible (fichier doc).

21/06/2006

5 astuces pour créer des liens

A lire sur le blog de Malaiac, la traduction en français d'un article de Randfish sur SEOMoz : "Cinq tactiques originales de création de liens". Si le contenu de l'article n'est pas révolutionnaire, celui-ci a le mérite de rappeler des méthodes de création de liens éventuellement sous-exploitées.

14/06/2006

Interview avec Danica Brinton (Ask.com)

Contacté par l'équipe française du moteur de recherche Ask pour tester son moteur de recherche de blogs, j'ai pu m'entretenir par email avec l'équipe US, représentée par Danica Brinton. Voici donc une petite interview (Note for international readers : the interview is available in english as a Pdf file) :

SB : Bonjour, tout d'abord merci d'avoir accepté de répondre à ces quelques questions, pourriez vous vous présenter aux lecteurs ?

DB : De rien, c'est un plaisir Sébastien. Je m'appelle Danica Brinton, et je suis en charge du product management et de la localisation chez Ask.com.

SB : Qu'est-ce qui distingue votre moteur de recherche de blogs de ceux des concurrents ?

DB : Nous avons construit un système qui fournit de meilleurs résultats, donne accès à des contenus de qualité en maintenant un bas niveau de spam, le tout avec un fonctionnement très intuitif.

Nous pensons que les robots d'indexation utilisés par les moteurs de recherche classiques ne sont pas adaptés quand il s'agit d'explorer l'intégralité de la blogosphère. Les contenus syndiqués (NdT : les flux XML) sont un vrai défi pour les moteurs, qui doivent à la fois rendre compte de la diversité et de l'actualisation permanente de la blogosphère, tout en s'assurant de délivrer des résultats pertinents.

Les moteurs qui se contentent d'étendre les technologies de recherche web à la recherche de contenus syndiqués ne peuvent qu'échouer. A la différence du web statique, la blogosphère évolue trop rapidement pour que les réseaux de liens soient exploitables pour l'indexation des nouveaux contenus. Les moteurs de recherche se basant sur ces réseaux passent donc à coté d'informations importantes, ou alors doivent avoir recours à d'autres techniques (comme le ping), qui sont souvent sujettes au spam.

Ainsi, au lieu de crawler, Ask Blog & Feed Search utilise la base de flux que constituent les abonnements des centaines de milliers d'utilisateurs Bloglines, premier agrégateur mondial, pour alimenter son index. En l'absence de réseaux de liens fiable, ce sont encore les utilisateurs qui permettent le mieux de découvrir des flux à la fois d'actualité et de qualité. Cette "intelligence collective" protège également naturellement du spam, puisque les gens ne s'abonnent pas en général à des contenus de mauvaise qualité.

Bloglines étant l'agrégateur en ligne le plus utilisé et le plus ancien, Ask Blog & Feed Search bénéficie de l'index le plus robuste du web, comprenant des articles publiés de 2001 à il y a 5 minutes (ou moins), soit environ 1.5 millards de billets. De nouveaux articles sont indexés quotidiennement, au rythme de 4 à 6 millions par jour. Cet index est ensuite exploité via nos algorithmes de recherche maison, enrichis des données Bloglines, pour vous fournir des résultats d'une qualité sans précédent.

Nous croyons que notre solution propose les fonctionnalités les plus utiles et les plus intuitives. Ask Blog & Feed Search vous permet de chercher et de naviguer à travers trois types de résultats :

  • Les billets, c'est à dire les articles les plus pertinents par rapport à vos mots-clés. Environ 1.5 milliard sont indexés.
  • Les flux, c'est à dire les fils XML correspondant à vos mots-clés (signalés par leur favicon quand cela est possible). Environ 2.5 millions de flux uniques sont ainsi indexés, via Bloglines.
  • Les actualités, constituées en fait d'un sous-index comprenant 7000 sources environ.

Le tri des résultats peut se faire par pertinence, fraîcheur ou popularité. Le tri par pertinence mixe fraîcheur et popularité, c'est l'option par défaut. La tri par popularité se base lui une combinaison de plusieurs facteurs : nombre d'abonnés, citations et liens, et ExpertRank.

Vous pouvez voir un aperçu des flux simplement en passant votre souris sur les jumelles dans les pages de résultats. Cette technlogie brevetée vous permet ainsi de juger un flux rapidement avant de cliquer dessus.

Après avoir identifié des ressources pertinentes, il est également très simple de les gérer directement depuis les pages de résultats : utilisez simplement le menu déroulant "s'abonner" pour souscrire aux flux, pas seulement dans Bloglines, mais aussi dans d'autres services comme Google Reader, Newsgator, ou Netvibes. Utilisez le menu "Publier" pour soumettre la ressource à Bloglines, Blogmarks, Linkedfeed ou Mesfavs. Vous pouvez également mettre en place une recherche permanente, et être prévenu instantanément dès que de nouveaux contenus apparaissent dans la blogosphère pour vos mots-clés. Là encore, il vous est possible de vous abonner à cette recherche directement depuis l'interface, en utilisant le service de votre choix.

Notre moteur vous propose également des flux liés à votre recherche. Il s'agit des "Meilleurs flux" apparaissant à droite de l'écran.

Enfin, la recherche avancée vous permet d'affiner très précisement vos recherches, en permettant notamment de spécifier la langue des billets. Sur Ask, la recherche avancée est accessible très facilement, puisque un clic fait apparaître les options, sans rechargement de la page.

J'espère que vous me pardonnerez ma réponse un peu verbeuse ;)

SB : Pouvez-vous nous expliquer l'algorithme ExperRank, et comment celui-ci est utilisé dans la recherche de flux ?

DB : ExpertRank est un algorithme unique, qui se base sur les communautés et sur les thèmes (clusters). Les réseaux de liens ne sont pas des indices suffisants de la pertinence d'une ressource. Les réseaux de liens peuvent être crées de manière artificielle. Nous préférons nous fier à l'autorité qu'ont ces liens.

SB : Comment fonctionne l'indexation de votre moteur de recherche de blogs ? Comment les blogueurs peuvent-ils s'assurer l'indexation de leur flux ?

DB : Il suffit que les blogueurs s'abonnent à Bloglines pour que leur contenu soit indexé. C'est plutôt simple :)

SB : Comment votre moteur détermine-t-il les meilleurs flux affichés à droite des résultats ? Vous basez-vous sur ne nombre d'abonnés Bloglines ?

DB : Nous prenons effectivement en compte le nombre d'abonnements, mais nous examinons surtout les liens et les citations, et la valeur de ceux-ci. Et nous mettons en oeuvre nos recettes maison :)

SB : Votre moteur ne retourne pas les mêmes résultats pour les versions accentuées et non-accentuées d'un mot. Est-ce voulu ? Ne pensez-vous pas qu'il devrait afficher les mêmes résultats, l'omission des accents étant dûe la plupart du temps à la paresse ou à une mauvaise orthographe ?

DB : Merci pour ce retour. Je vais regarder ça. En général, nous prenons beaucoup de précautions en matière de normalisation. Nous avons observé que l'intention des utilisateurs pouvait être différente selon qu'ils cherchaient avec ou sans accents. Mais vous avez raison : très souvent, l'omission des accents trouve son origine dans l'utilisation d'un clavier anglais ou dans la volonté de taper plus vite. Si vous avez d'autres commentaires sur notre produit, n'hésitez pas à nous les faire parvenir. Notre site français est encore une version beta, et les retours d'utilisateurs avancés comme vous n'ont pas de prix.

SB : J'ai remarqué plusieurs Digg-likes indexés dans vos pages de résultats, comme Tapemoi ou Fuzz. Ce type de service liste seulement des liens vers des ressources, mais ne sont pas des ressources eux-mêmes. Fréquement, ces services reprennent le titre des ressources qu'ils référencent, laissant penser à l'utilisateur que la ressource est à un clic de vos pages de résultats, alors que l'utilisateur tombera en fait sur la page du Digg-like où il devra encore cliquer... Considérez vous que cela affecte votre pertinence, et si c'est le cas, travaillez vous à des solutions ?

DB : Je suis là encore d'accord avec vous. Nous sommes en train d'examiner avec attention ces sites. Il y a là un défi à relever.

SB : Utilisez vous des algorithmes ou une intervention humaine pour éviter l'indexation de flux qui ne sont que des outils et non de l'information ? Je pense par exemple aux flux de Wikipedia permettant de suivre les modifications des pages.

DB : Nous procédons de façon algorithmique. Vous ne m'en voudrez pas si le reste reste un secret :)

SB : J'ai remarqué dans vos pages de résultats que certains liens utilisaient des URLs de redirection, commençant par wzeu.ask.com. Un des paramètres de ces URLs est nommé "ip". S'agit-il d'évaluer la qualité de vos résultats ? De personnaliser les résultats ?

DB : Bien vu ! Mais cela reste confidentiel, j'espère que vous ne m'en voudrez pas là encore :)

SB : Une dernière question, concernant la recherche web : Quand la fonction Zoom sera-t-elle disponible pour le public français ?

DB : Nous ajoutons constamment des fonctionnalités à nos sites. Zoom est une fonctionnalité que nous lancerons sur nos sites à l'international une fois la phase beta terminée.

12/06/2006

Google blues

Décidément, Google semble bien avoir perdu son mojo, et le changement d'ère que j'avais évoqué fin 2005 se poursuit : après avoir perdu des partenaires importants en mai, Google fait face à une vague croissante de scepticisme de la part des observateurs du monde du Search :

Om Malik se demande ainsi si Google "gâche son temps cerveau", Seth Jayson explique comment Google est en train selon lui de "tuer l'internet", Olivier Andrieu examine les raisons éventuelles du déclin du moteur, Emmanuel Parody exprime sa lassitude vis-à-vis du buzz-marketing, et TechCrunch enfonce le clou en dénonçant l'enthousiasme aveugle qui suit chaque lancement Google, en se demandant "à quand remonte la dernière fois où Google a lancé un produit qui a changé nos vies ?"...

PS : Pour une traduction de l'article de Seth Jayson "How Google Is Killing the Internet", voir le blog de Jean-Marie Le Ray.

8/06/2006

Des outils pour le Search Marketing avec Adcenter Labs

Le Adcenter Labs de Microsoft, en version beta, présente un certain nombre d'outils à destination des annonceurs et des consultants en Search Marketing.

Attention : ces applications ne sont pour l'instant que des démonstration technologiques, et la taille des échantillons n'est pas précisée. Il serait donc hasardeux de baser une décision sur les seules données fournies. Il n'empêche que Microsoft a à mon avis fait fort, en proposant des fonctionnalités d'analyse poussée du comportement des utilisateurs, et on ne peut qu'esperer que ces services soient rapidement opérationnels.

Un petit aperçu des deux outils les plus intéressants à mon sens :

Le Search Funnel permet de determiner les mots-clés tapés avant ou après une requête. On peut par exemple voir que parmi les gens ayant tapé "cholesterol", 5.09% ont ensuite fait une recherche sur "triglyceride", 3.56% ont fait une recherche sur "cholesterol level", etc. A l'inverse, on peut aussi voir que parmi les gens ayant tapé "cholesterol", 8.45% avaient auparavant cherché "cholesteral", 2.18% "triglyceride", 2.1% "cholestorol" etc.

Les Demographics Predictions permettent quand à elles d'obtenir des données démographiques sur les visiteurs ayant cherché un mot-clé ou visité un site donné. On y apprend que l'audience de Slashdot est à 71% masculine, et d'un âge plutôt compris entre 18 et 50 ans, et que 63% des gens ayant cherché "Billy Crawford" sont de sexe féminin, et d'un âge en général inférieur à 35 ans.

23/05/2006

Un attribut pour s'affranchir des descriptions DMOZ

DMOZ est le plus grand annuaire mondial. Malheureusement, cet annuaire maintenu par des bénévoles souffre d'une inertie considérable, et les webmasters doivent parfois patienter des mois, voire des années, avant que leur site soit indexé ou que sa description soit modifiée. Il arrive donc que les moteurs utilisant DMOZ affichent des données inexactes ou obsolètes.

Conscient de ce problème, MSN Search propose désormais un moyen de forcer ses pages de résultats à ne plus afficher la description de l'annuaire DMOZ, sous la forme d'une simple balise meta (ou plus exactement d'un attribut "noodp" à destination des robots d'indexation) :

<meta name="robots" content="noodp">

Cette balise, insérée dans le <head> des pages, forcera ainsi le moteur à afficher des extraits de celles-ci au lieu de la description de l'annuaire.

Il serait bon que l'ensemble des moteurs reconnaissent cet attribut, comme cela c'était déjà passé pour l'attribut "nofollow"...

Quoi de neuf du coté de chez MSN ?

Invité à la Windows Live Session vendredi dernier (Merci Heaven), voici les quelques infos que j'ai pû glaner concernant la partie "search" de Windows Live (qui est un projet bien plus vaste).

Le moteur de recherche cartographique, Windows Live Local, devrait être disponible pour la France et l'Europe cet été.

Le service de recherche de réponse Live QnA nous a également été présenté. Globalement il s'agit d'un service communautaire permettant aux utilisateurs de poser des questions et d'y répondre. Le rapport signal/bruit devrait donc y être meilleur qu'une recherche web pour certaines questions éminemment subjectives ("Quel est la meilleure brasserie de Lille ?") ou nécessitant une réponse développée ("En quoi l'école Theravada ne peut-elle être qualifiée d'Hinayana ?"). Un système de "kudos" (bons points) permet d'identifier les contributeurs les plus fiables et les plus actifs, qui pourront les convertir en cadeaux. Lorsque j'ai interrogé Phil Holden, en charge du projet Windows Live à Redmond, à propos de l'utilisation possible des données de QnA pour améliorer la pertinence du moteur de recherche web, celui-ci m'a répondu qu'ils n'en avaient aucune idée pour l'instant.

Phil Holden a également fait le point sur la recherche web, en précisant que MSN travaillait à l'amélioration de sa pertinence. Des progrès mesurables et significatifs ont été accomplis (Un scoring est fait en interne pour confronter les résultats MSN et Google), mais l'équipe admet qu'il reste encore du travail.

22/05/2006

Billet modifié à la demande de Ru1st le 28/06/06

Le contenu original de ce billet a été édité suite à un email de M. Jeremy Adams, gérant de la société Ru1st, m'accusant de diffamation.

Je conteste totalement le fait qu'il y ait eu diffamation. Néanmoins, souhaitant profiter de mes congés et éviter les tracas inutiles, j'en ai modifié son contenu (tout en conservant précieusement le billet original, ainsi que les échanges par email avec M. Adams).

Je rappelerai juste quelques éléments de pur fait :

  • J'ai été démarché le 22 mai au téléphone par une personne affirmant travailler chez Google (Ru1st étant d'après cette personne une "cellule spéciale crée par Google France").
  • Cette personne travaillait en fait pour la société Ru1st, qui n'a absolument aucun lien avec Google, si ce n'est qu'elle revend des Adwords.
  • Une personne de chez Google m'a confirmé par téléphone que leur service juridique était au courant des agissements de cette société, suite à de nombreux appels de personnes démarchées par Ru1st.

Le lecteurs se feront leur propre opinion...

(Je mets également hors-ligne les commentaires des lecteurs, sans les supprimer cependant)

18/05/2006

La recherche d'informations, première activité sur Internet

La lettre d'information de l'INSEE (Pdf) fournit ce mois-ci des chiffres sur l'utilisation d'internet par les français, chiffres basés sur une étude effectuée en octobre 2005.

On y apprend notamment que la recherche d'informations est l'activité à titre privé la plus pratiquée sur le web (devant la messagerie électronique), la recherche documentaire arrivant en troisième position.

Les internautes semblent d'ailleurs avoir bien intégré les outils de recherche, puisque neuf sur dix affirment savoir les utiliser (On peut cependant se demander dans quelle mesure).

17/05/2006

Bigdaddy et stratégie de liens

Dans un long billet, Matt Cutts revient sur la mise en place de Bigdaddy, la désindexation de certains sites, et fournit des éléments laissant à penser qu'une stratégie de liens trop fortement basée sur l'achat de liens ou l'échange de liens réciproques peut être nuisible.

Sur Bigdaddy : Cette mise à jour logicielle de de l'algorithme a concerné essentiellement la partie du moteur dédiée au crawling, et dans une moindre mesure, celle dédiée à l'indexation. Débuté en décembre 2005, le déploiement de Bigdaddy s'est achevé fin mars.

De nombreux webmasters ont signalé au début de Bigdaddy la désindexation d'une partie de leur site. Après examen, il s'est avéré que les sites désindexés affichaient en général des liens de qualité douteuse, comme des liens réciproques trop systématiques, ou des liens vers des réseaux identifiés comme étant du spam. En conséquence, la tolérance de l'algorithme a été revue à la hausse, afin d'indexer plus de pages de ce type.

Certains sites continuent cependant d'afficher un nombre réduit de pages indexées. Matt Cutts donne quelques pistes pour expliquer ce phénomène : "Je m'intéresserais en priorité à la qualité de mes liens si je voulais voir plus de pages crawlées. Depuis cet update, nous avons amélioré la façon dont nous traitons les liens réciproques et l'achat de liens (...) Si vous étiez crawlé plus fréquemment avant l'update, et que vous échangez beaucoup de liens réciproques, ne soyez pas surpris si le nouveau robot a désormais d'autres priorités et vient moins fréquemment (...) Il est probable que des webmasters très actifs dans l'échange de liens se voient moins crawlés (...) Si vous avez un site qui ne fait que de l'affiliation, il serait bon de penser à la valeur ajoutée que votre site apporte à l'utilisateur".

15/05/2006

Crise chez Google : plus de M&M's !

Il semblerait qu'un conflit oppose certains employés Google à leur direction, suite au remplacement des M&M's en libre service par des céréales.

Officiellement, la décision aurait été prise pour des raisons de santé. Officieusement, il s'agirait d'une mesure destinée à réduire les coûts. La décision laisse à certains "un arrière goût amère que les M&M's ne feront pas passer". Ah vraiment c'est plus ce que c'était Google...

< 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 >