Dans une interview accordée à Stephan Spencer, Matt Cutts laisse filtrer quelques informations sur les méthode employées par Google et tord le cou à plusieurs mythes. Résumé des points les plus intéressants :

  • Le PageRank est bien l'un des indicateurs employé par Google pour determiner quelle version d'un contenu dupliqué en plusieurs endroits est la version originale.
  • Il existe encore quelques moyens non documentés d'identifier les pages en résultats complémentaires, mais la distinction entre les deux index n'a plus vraiment de sens aujourd'hui.
  • Concernant l'indexation du contenu des fichiers Flash, Google utilisait originellement un parser développé en interne, mais utiliserait désormais le SDK fourni par Adobe.
  • Les liens issus des sites sociaux de mise en favori type del.icio.us ne sont aucunement dépreciés. Un lien est un lien, sauf usage éventuel de l'attribut nofollow.
  • Les liens issus de domaines en .edu ou .gov ne se voient pas reconnaître un poids plus fort du seul fait de leur extension. Par contre Matt Cutts laisse entendre que d'autres signaux seraient transmis via les liens, qui seraient basés sur la qualité et la confiance.
  • La vision "100% algorithmique" du moteur dans le passé était justifiée par le fait que Google disposait alors de peu de moyens humains. Matt Cutts pense aujourd'hui que l'intervention humaine peut être bénéfique, à condition d'être extensible ("scalable") et fiable .
  • L'achat de lien est efficace ! Matt Cutts explique en fait que la tactique consistant à acheter des liens vers ses concurrents pour ensuite les dénoncer risque d'aider ces derniers plutôt que de les handicaper.