Référencement, Design et Cie

Aller au contenu | Aller au menu | Aller à la recherche ©

2/09/2008

Google sur le point de lancer son navigateur Chrome

Le sujet était évoqué régulièrement, certains y croyant, d'autre étant plus sceptiques (dont moi, je dois bien l'avouer). Mais Google s'apprète bien à lancer son navigateur, en version beta et en open-source, dans 100 pays.

En lisant la BD d'introduction à Chrome, on y apprend un certain nombre de choses très intéressantes : ainsi, le moteur de Chrome est basé sur Webkit, un navigateur open-source également utilisé dans Safari. Etant donné que javascript est une technologie abondamment utilisée aujourd'hui pour les interface web, Chrome bénéficie d'une machine virtuelle javascript écrite à partir de zéro, et spécialement optimisée pour les applications javascript complexes. Ainsi au lieu d'interprêter le code javascript et de l'exécuter, Chrome le compile à la volée en langage machine, ce qui permet son éxécution directe par le CPU, d'où une plus grande rapidité

Un gros accent a été mis sur la stabilité : chaque page web et chaque javascript sont exécutés dans des processus séparés, ce qui permet une meilleure gestion de la mémoire, de meilleurs temps de réponses, et surtout permet en cas de bug de fermer uniquement le processus defectueux au lieu de planter le navigateur.

En ce qui concerne l'interface, les onglets sont un concept clé de Chrome, au point que ceux-ci ont été placé au sommet du navigateur. Il est possible de les déplacer d'une fenêtre à une autre, et chaque onglet comprend ses propres controles (barre d'adresse , boutons précédent / suivant ...). La barre d'adresse va au delà de la simple gestion des URLs et a été baptisée "Omnibox". On y retrouve toutes sortes d'informations : suggestions de recherches, historique des recherches et des visites etc.

La plupart des navigateurs proposent une page par défaut, qui peut être une page blanche ou une URL spécifiée par l'utilisateur. Google Chrome propose une page par défaut générée dynamiquement, qui affiche les 9 sites les plus visités, et les formulaires de recherche les plus utilisés.

Un mode "incognito" a également été implémenté, qui permet d'ouvrir une fenêtre ou rien, ni historique no cookies, ne sera enregistré sur la machine. Enfin, Chrome comprend plusieurs dispositifs destinés à protégér l'utilisateurs des malware et du phishing.

Une dernière chose à noter est que si le navigateur est en version beta, les versions de développement on été testées... par des machines ! Utilisant son infrastructure informatique, Google est ainsi capable dans les 20 à 30 minutes de tester chaque release sur des dizaines de milliers de pages différentes fréquemment visitées par les internautes. Même le rendu des pages a été testé de façon automatique, et Chrome est capable de passer avec succès plus de 99% des tests de rendu de Webkit.

A lire également sur l'impact vis-à-vis de Firefox : "A propos de Google Chrome et du reste" par Tristan Nitot. Et quelques captures d'écran et vidéos sur Techcrunch.

Edit : on peut désormais télécharger Google Chrome.

27/08/2008

Flash, Référencement, PageRank et Sitemaps : infos en vrac

L'interview par Eric Enge de Maile Ohye, en charge du support aux webmasters chez Google, constitue une lecture intéressante. Parmi les points notables :

Le fait d'utiliser un sitemap RSS au lieu d'un sitemap statique classique (XML ou texte) n'a aucune influence sur la rapidité d'indexation. Maile précise d'ailleurs que le protocole sitemap concerne surtout la découverte des URLs à crawler plus que l'indexation proprement dite.

Le fait d'augmenter la vitesse d'indexation dans l'interface Webmaster Tools peut conduire à l'indexation d'un plus grand nombre de pages.

Les liens dans les fichiers Flash sont bien suivis par le moteur, et ont la capacité de transmettre du PageRank. En ce qui concerne les différentes méthodes de contenu alternatif utilisée pour l'accessibilité et le référencement des sites Flash, Maile précise que le contenu alternatif n'a pas forcément à être strictement identique, mais il doit alors décrire de façon très fidèle la teneur du contenu Flash. Mail insiste également sur l'importance de l'accessibilité et sur le concept d'amélioration progressive (proche de celui de dégradation élégante).

20/08/2008

De l'intérêt de placer des liens au sein du contenu

Les brevets déposés par les moteurs de recherche constituent une source d'information très intéressante pour qui s'intéresse au référencement. Même si le simple dépôt de brevets ne signifie pas leur mise en oeuvre effective, leur lecture permet de mieux cerner les méthodes employées par les moteurs de recherche.

Dans son dernier billet, Olivier Duffez décortique un brevet attribué à Google en décembre 2007, intitulé "Anchor tag indexing in a web crawler system" (ce brevet est également commenté par Bill Slawski).

Si Olivier s'est surtout intéressé à la description du système de crawl, l'information la plus intéressante reste pour moi le fait que le texte entourant un lien est utilisé comme un signal dans l'évaluation de la pertinence de la page de destination par rapport à une requête donnée.

La quantité de texte retenue par le moteur utilise principalement la notion de distance par rapport à l'ancre du lien : le texte situé à x caractères à droite et à gauche du lien sera ainsi utilisé. Mais cette distance peut être modulée en fonction des autres ancres de liens à proximité, de la quantité de texte totale du document ainsi que d'autres critères.

Il y a donc tout intérêt, aussi bien pour l'utilisateur que pour les moteurs, à placer des liens au sein même des contenus, et à ne pas réserver ceux-ci aux seuls éléments de navigation. Ces liens seront fortement porteurs de pertinence, puisque non seulement leur ancre sera prise en compte, mais probablement aussi le texte attenant (d'ailleurs c'est déjà le cas avec Google Images).

Cette forme d'écriture, si elle est courante dans la blogosphère, reste encore trop rare sur le reste du web...

8/08/2008

Microsoft Live Search améliore ses Webmaster Tools

Google n'est pas le seul à proposer une interface à destination des webmasters. Lancée depuis novembre 2007, la version Microsoft des Webmaster Tools vient de s'enrichir de nouvelles fonctionnalités.

L'interface permet désormais de mieux identifier les problèmes d'indexation (erreurs 404, mauvaise gestion des robots, URLs trop longues, formats non supportés) et fournit davantage de données concernant les liens entrants, qu'il est possible de télécharger au format CSV.

Présent à l'université d'été Medialibs sur l'avenir du web

J'aurai l'honneur d'intervenir le vendredi 5 septembre lors de l'université d'été (PDF) organisée par la société Medialibs qui aura pour thème de "l'avenir du web". Ce sera l'occasion de faire le point sur l'état actuel du référencement, et de réfléchir sur ses possibles évolutions.

Cet évènement aura lieu à l'abbaye de Saint-Florent le Vieil, entre Nantes et Angers. Envie de vous y inscrire ? C'est par ici.

1/08/2008

Offre de stage : assistant(e) SEO/SEM chez Relevant Traffic

Relevant Traffic France, agence spécialisée en Search Marketing, recherche un stagiaire ou un candidat en alternance pour une durée de 4 à 10 mois, à compter de septembre 2008 (temps plein, éventuellement mi-temps). Le poste est situé à Paris (9ème).

Au sein de nos équipes de production, en référencement naturel tout comme en référencement payant, vous contribuerez au support et à l’assistance sur l’ensemble de nos campagnes et prestations. Vous partagerez le quotidien de nos équipes en vous formant aux métiers du web et de l’internet, auprès de consultants aguerris . Vous interviendrez sur des projets ponctuels, avec à terme la prise en charge de prestations SEO ou de campagnes de liens sponsorisés.

Vos missions

Vos différentes tâches incluront :

  • La préparation et la création de campagnes de liens sponsorisés (estimations, conceptions de campagnes et d’annonces, mise en ligne...)
  • La préparation et le support de nos missions de conseil en référencement naturel (travaux préparatoires, analyse de trafic, rapports de positionnement...)
  • La conception de rapports, de bilans de campagnes intermédiaires, et d’analyses statistiques.

Votre Profil

  • De formation supérieure, bac +3 à +4.
  • Cycle long ou en alternance.
  • Un excellent relationnel, une bonne présentation, de la rigueur, de l’organisation et un sens de l’écoute.
  • Une passion ou un intérêt réel pour le monde du référencement et de l’internet.
  • Anglais souhaité. Autres langues appréciées.

Une première expérience de l'internet ou du webmarketing serait un plus (à titre personnel ou professionnel), de même qu'une bonne connaissances des moteurs de recherche et outils (Google Analytics, Xiti, etc.)

Envie de postuler ? Envoyez votre CV accompagné d'une courte lettre de motivation à jobs@relevanttraffic.com.

Google, c'est le Mal (et je le prouve)

Un moteur de recherche est une combinaison de cerveaux et de moyens financiers. Relation que l'on peut modéliser de la sorte :

Google = Cerveaux * Argent

Mais les cerveaux ont eux-même un coût. Ainsi :

Google = Argent * Argent = (Argent)²

La Bible (Timothée 6:10) nous enseigne que l'argent est la racine de tout mal (Argent = √Mal), soit :

Google = (√Mal)²

Expression qui une fois simplifiée nous prouve que, malgré son slogan "do no evil", Google représente bien l'incarnation du Mal :

Google = Mal

Bon vendredi ;)

24/07/2008

La barre d'outils Google n'est pas utilisée pour l'indexation

Matt Cutts a confirmé dans un récent billet que la barre d'outils Google n'était pas utilisée par le moteur comme un moyen d'indexer de nouvelles pages.

En fait, ce n'est pas vraiment la première fois que Matt Cutts s'exprime à ce sujet, puisque des tests avaient déjà été effectués en 2006, concluant tous à la non-utilisation de la Googlebar pour l'indexation. Mais les mythes ont la vie dure (j'ai moi-même souvent pensé que la barre pouvait constituer un intéressant crawler distribué).

Répondant à certains commentaires, Matt Cutts affirme également qu'à sa connaissance ni Gmail, ni Google Talk, ni Google Analytics ne sont exploités pour indexer de nouvelles URLs.

Comment expliquer alors que des URLs "secrètes", n'ayant fait l'objet d'aucune promotion se retrouvent indexées ? En fait ces URLs ont probablement généré des liens sans le savoir, par exemple en apparaissant en tant que referer dans des services de statistiques publiquement accessibles, en tant que bookmark dans un système de partage de favoris, ou en étant listées sur certains sites publiant les noms de domaine nouvellement créés.

Restent certains phénomènes inexpliqués...

18/07/2008

SEO + Parano = Pipo

Descartes a un jour écrit que le bon sens était la chose du monde la mieux partagée. Il ne devait compter ni webmasters ni référenceurs dans ses fréquentations. Car dans cette population, j'ai parfois l'impression que la distribution du bon sens est au moins aussi inégale que celle du PageRank.

Un exemple de ce manque de rationalité est l'emploi abusif du concept de pénalisation : quand un webmaster observe un déclassement de son site, il invoque immédiatement le terme de "pénalité". Il ne lui viendrait pas à l'idée que son positionnement n'est que le résultat d'une méthode de classement automatisée d'un ensemble de documents en perpetuelle évolution. Les ajustements de cette méthode de classement peuvent très bien provoquer des variations. De même que les ajustement des infrastructures techniques permettant de mettre en oeuvre ces méthodes. De même que des erreurs dans la mise en oeuvre de tout cela. Mais non, une baisse de positionnement est pour lui forcément une pénalité, une punition divine.

Mais le webmaster dans sa paranoïa va encore plus loin : ne comprenant pas pourquoi il est pénalisé (si tant est qu'il le soit vraiment), il invente pour se justifier le concept de "pénalité aléatoire" (random penalty): Google punit on ne sait pas trop quoi exactement, mais en plus au hasard. Peut-être une application de l'adage "si ce n'est toi c'est donc ton frère" ?

Le webmaster gagnerait à penser comme un ingénieur d'un moteur de recherche avant des développer des théories de "machinbox" et "bidule penalty"...

27/06/2008

Quelles pratiques de recrutement et de rémunération dans le référencement ?

Afin d'avoir une vision plus claire du marché de l'emploi du référencement, l'association SEO Camp lance une enquête sur les pratiques de recrutement et de rémunération des entreprises employant des référenceurs (agences et annonceurs).

Pour y répondre, c'est par ici (questionnaire à destination des entreprises).

Le conseil SEO du vendredi

Beaucoup d'entre vous se posent la question de savoir quelle est la densité de mots-clés idéale pour bien se positionner sur une expression donnée. Si c'est votre cas, voici une régle facilement applicable :

"Il en faut plus que pas assez, et moins que trop".

26/06/2008

Les symboles ASCII ou Unicode dans la balise title sont-ils du spam ?

Lors de vos recherches web, il vous est probablement arrivé de tomber sur certains sites affichant des caractères spéciaux dans leur balise <title> ou leur snippet, dans le seul but de capter l'attention de l'utilisateur dans une page de résultats (exemple).

Les caractères utilisés sont multiples (➜, ►, ♥, ♫, ☼...) et peuvent être combinés (exemples : ••▷, II►, ➜➜➜).

Cette technique est-elle constitutive de spam ? Certes, ces caractères n'ont pas d'influence sur le positionnement, mais ils donnent aux sites qui les emploient une visibilité accrue dans les pages de résultats, sans que cela soit lié à leur pertinence.

Il est d'ailleurs intéressant de constater que les moteurs traitent différement ces caractères : Google, Live et Exalead peuvent les afficher aussi bien dans le lien que dans le snippet des sites, tandis que Yahoo semble avoir choisi de les filtrer complètement.

Afin, d'en savoir plus, j'ai interrogé les Googlers via le groupe Google d'entraide pour les webmasters. Il apparaît que l'usage abusif de caractères Unicode ou ASCII dans les balises <title> ou <meta> est bien considéré comme une forme de spam par les équipes qualité du moteur, pouvant justifier une pénalisation du site. Google, fidèle à l'esprit de ses guidelines, décourage clairement l'utilisation de ce type de technique.

Reste à savoir ce qui relève de l'abus ou pas. Google ne souhaite volontairement pas fixer de limites claires, afin de ne pas légitimer un usage même léger de la technique. On en revient donc à la question suprême, qui est à l'évaluation du spam ce que le rasoir d'Occam est à la science : "Ce qui est fait est-il fait pour l'utilisateur, ou bien uniquement pour les moteurs de recherche ?".

20/06/2008

La définition SEO du vendredi : Trusted Feed

Trusted feeds : Levier de promotion unique cumulant les inconvénients respectifs du référencement naturel et ceux des liens sponsorisés, à savoir une visibilité aléatoire assortie d'un coût au clic élevé.

Chat Google : traduction des réponses les plus intéressantes

Hier avait lieu le second chat de Google à destination des webmasters. Traduction des questions et réponses les plus intéressantes, à partir du transcript de Search Engine Roundtable.

Q : Google est-il en mesure d'indexer les sites Flash ?

R : Plus ou moins. Nous pouvons bien extraire quelques informations des fichiers Flash, mais cela n'a rien de comparable avec l'indexation des contenus HTML.

Q : Google voit-il d'un mauvais oeil le fait d'écrire tout en majuscules ?

R : Non, nous prenons les lettres telles qu'elles se présentent :)

Q : Une question à propos de l'internationalisation : je possède un site avec plusieurs répertoires (un par pays), enregistrés comme tels dans Webmaster Tools. Cela est-il suffisant pour éviter la duplication de contenu pour un site avec des déclinaisons anglaises, américaines et australiennes ?

R : C'est en général suffisant. Je vérifierais également que les pages sont bien conçues pour ces différentes audiences, car il n'y pas de vrai intérêt à envoyer des utilisateurs de différentes régions sur une page générale. Dans ce cas, j'utiliserais une page unique sans ciblage géographique (...) le ciblage géographique ne change rien au fait que nous souhaitons retourner une seule version d'un même document dans nos résultats.

Q : Y a-t-il une limite à l'usage des redirection 301 sur un site web ?

R : Il n'y a pas de limites en soi concernant le nombre de redirections 301. Vous pouvez tout à fait rediriger d'un coup 100.000 URLs. Toutefois, si nous constatons un grand nombre de redirections successives, nous pouvons décider de ne pas suivre jusqu'au bout cette chaine de redirections.

Q : Lorsqu'un site est conçu entièrement en CSS, Google ignore-t-il la feuille de style pour ne s'intéresser qu'au contenu HTML ?

R : La plupart du temps, nous ignorons les feuilles de style, mais nous pouvons les regarder dans certains cas (par exemple pour vérifier la présence de texte caché).

Q : Google extrait-il une quelconque information des liens en nofollow, par exemple l'ancre du lien ?

R : Non, le lien est tout simplement supprimé de notre graphe de lien (il est donc ignoré).

Q : Matt, existe-t-il quelques recommandations concernant la densité des mots-clés ? Nous avons des pages très spécialisées, et la densité pour certaines expressions est assez élevée.

R : Vous ne le croirez peut-être pas, mais nous nous soucions finalement assez peu de la densité chez Google, parce que nos algorithmes s'en sortent très bien. Mon conseil serait de faire lire vos textes à une personne ordinaire. S'il elle fronce les sourcils, alors c'est peut-être qu'il y a un problème...

Q : Google fait-il une différence entre une recherche en minuscule et en majuscule ?

R : Nous pouvons dans certains cas, quand nous jugeons que cela est pertinent par rapport à la requête.

Q : Comment expliquez-vous que Google indexe un site, puis que ce site disparaisse de l'index quelques jours après ?

R : Cela peut arriver parfois pour de tous nouveaux sites, mais la situation se stabilise ensuite. Dans ce cas il suffit de patienter un peu.

Q : Combien de temps faut-il pour que les réponses HTTP 301 et 410 soient prises en compte ?

R : Elles ne peuvent être prises en compte que quand les pages sont accédées. A partir du moment où nous prenons connaissance de la redirection, celle-ci est en général repercutée dans l'index en quelques jours.

Q : Si du code en commentaire contient des mots-clés, cela peut-il être vu comme du spam par Google ?

R : le code commenté est ignoré par les robots. Ces commentaires n'auront donc aucune influence.

Q : Comment Google gère-t-il les microformats ? Puis-je les utiliser pour un meilleur référencement ?

R : Pour autant que je sache, le principal microformat que nous prenons en compte est l'attribut nofollow. Je ne pense pas que nous en utilisions d'autres. Mais nous menons une veille sur le sujet, au cas où :)

Q : Si un site copie mon contenu, existe-t-il une possibilité pour le dénoncer ?

R : Oui, www.google.com/dmca.html

Q : En général, quel pourcentage de pages Google indexe-t-il pour les gros sites ?

R : Cela dépend de la taille du site, de son PageRank, et de plein d'autres facteurs. Difficile de généraliser.

Q : GoogleBot préfère-t-il les URLs longues, ou courtes ?

R : GoogleBot n'a pas de préférence particulière. Les utilisateurs tendent à préférer les URLs courtes, pour des questions d'utilisabilité.

Q : Dans quelle mesure utilisez vous LSI dans votre algorithme ?

R : En tant que webmasters, vous n'avez en général pas à vous soucier de tels détails. Ecrire pour l'utilisateur est bien plus pertinent que de produire du contenu basé sur des indices artificiels.

Q : Est-ce que Google supporte ou envisage de supporter le microformat hCard ?

R : Actuellement, je ne pense pas, mais nous sommes ouverts aux idées nouvelles !

Q : Empêcher l'indexation des pages de faibles intérêt permet-il aux autres pages du site de mieux se positionner ?

R : S'il s'agit de pages ordinaires, je ne les enleverais pas de l'index. S'il s'agit de pages "spammy", et que vous suspectez qu'elle ont pu affecter votre positionnement, alors oui, je les supprimerais.

Q : Le temps de chargement des pages a-t-il une influence sur le positionnement ?

R : Le temps de chargement est important pour la satisfaction de l'utilisateur. Mais il n'est pas actuellement considéré par Google comme un signal devant influencer le positionnement.

Q : Google envisage-t-il de prendre en compte les balises meta de géolocalisation ? Quel standard serait indiqué ?

R : Non, nous ne les utilisons pas.

Q : La localisation des serveurs affecte-t-elle la visibilité du site dans les résultats locaux ?

R : Parfois. Nous regardons la localisation du serveur et l'extension du nom de domaine, entre autres choses.

Q : Est-ce que la connaissance qu'a Google de l'activité des visiteurs (via Google Analytics) a un impact sur le positionnement ?

R : Non, aucun.

Q : Existe-t-il un moyen de signaler à Google que le site qu'il indexe est un site mobile ? Car en ce moment nous avons des problèmes de duplication de contenu entre www.monsite.com et m.monsite.com...

R : Vous pouvez utiliser les sitemaps pour mobile, cela pourra aider.

Q : Combien de temps faut-il attendre avant que le ciblage géographique soit effectivement pris en compte ?

R : Cela peut prendre plusieurs semaines, je pense.

13/06/2008

La définition SEO du vendredi : Alexa

Alexa : jeune californienne qui, si elle affiche de jolies courbes, s'avère peu fiable.

< 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 >