Le Blogueur

L’actualité du net

Google prêt à indexer des documents scannés

Par Guy Vigneault • 21 nov, 2008 • Catégorie: Google, Informatique, Moteur de recherche, Techno

Article publié originellement chez Techcrunch, le 31 octobre, 2008

googlelogo.pngGoogle a annoncé son intention de commencer à inclure des documents scannés dans ses résultats de recherche ce qui requiert une quantité de travail importante et  une prouesse technologique via reconnaissance d’image. A la différence des documents textes standards, les document scannés ne contiennent aucunes données texte que les robots de Google peuvent détecter. Google utilise la technologie de reconnaissance optique de caractères , transformant les photos de mots en textes numériques.

Jusque la Google n’avait réussi qu’a détecter les textes qui entouraient une image, comme le titre par exemple mais jamais le contenu visuel de l’image. Dorénavant Google sera capable de référencer le texte présent à l’intérieur même de l’image. Quand vous tombez sur un document scanné dans un résultat de recherche vous pourrez le voir en PDF ou en format texte via HTML.

Cette technologie n’est pas nouvelle mais n’a  encore jamais fait preuve d’une véritable précision et le fait que Google parvienne à le faire sur une si grande échelle est impressionnant. Cela va également permettre d’élargir le champ des recherches et de découvrir du contenu qui n’existait que sur papier.

Voici un exemple: Repairing Aluminum Wiring et plus de détails sur cette annonce ici.

Partager et découvrir :
  • Digg
  • del.icio.us
  • Facebook
  • Google
  • BlogMemes Fr
  • NewsVine
  • Pownce
  • Scoopeo
  • StumbleUpon
  • Wikio FR
  • Technorati
  • Wikio
  • BlogMemes
  • Blogsvine
  • LinkedIn
  • Ma.gnolia
  • Ping.fm
  • Reddit
  • Slashdot
Marqué comme: , , ,

Guy Vigneault est
Email à cet auteur | Tous les Articles par Guy Vigneault

Laisser un Commentaire