Dans un article intitulé "Eleven tips for optimizing PDFs for search engines", Galen DeYoung propose 11 astuces pour mieux référencer les fichiers Acrobat. Résumé rapide :

  • Assurez vous que les textes de vos PDFs soient bien du texte, et non du texte vectorisé ou dans un format bitmap.
  • Renseignez les propriétés des documents, qui sont au fichiers Acrobat ce que les balises <title> et <meta> sont aux documents HTML, en particulier la propriété "title".
  • Travaillez la teneur de votre contenu, tout comme vous le feriez avec une page web.
  • Incluez des liens vers votre site dans vos documents, en veillant à utiliser des intitulés de liens pertinents.
  • Faites attention aux versions de format, les moteurs pouvant ne pas être compatibles avec les dernières versions d'Acrobat. Préférez le format Acrobat 7 au format Acrobat 8.
  • Veillez à garder une taille de fichier raisonnable. Si vos fichiers sont trop volumineux, tout leur contenu ne sera pas indexé.
  • Arrangez-vous pour que vos PDFs soient trouvés facilement par les moteurs, en les positionnant dans le haut dans votre arborescence.
  • Influencez la description de vos PDFs dans les pages de résultats, en faisant en sorte de placer du texte pertinent dès le début des documents (technique de "front loading").
  • Spécifiez l'ordre de lecture des éléments composant votre PDF, en utilisant les fonctions d'accessibilité d'Acrobat.
  • Taggez vos PDFs, toujours grâce aux options d'accessibilité. Definissez titres et textes alternatifs pour les images.
  • Soyez attentifs, en vérifiant l'ensemble de ces points à chaque édition de vos PDFs.

A lire également sur le sujet : cet article de WebAIM sur l'accessibilité des fichiers PDF (en anglais).