Google indexe depuis déjà longtemps les documents publiés au format PDF (Adobe Acrobat). Si jusque ici la partie indexable de ces documents se limitait au contenu texte, Google est désormais en mesure d'indexer également le texte des images contenues dans les PDFs, par l'usage de technologies de reconnaissance des caractères (OCR).

Cette nouvelle constitue à mon sens une avancée notable pour le chercheur sérieux, puisque l'on trouve fréquemment dans les fichiers PDF de l'information de qualité. A quand l'application de cette technologies pour le moteur de recherche d'images ?