New Documents numérisés consultables et une vis commun jusqu'à
Janvier 5, 2009 par Michael Alexander · Laissez un commentaire
Je mentionne G oogle si souvent que beaucoup de gens doivent penser que je suis payé par l'entreprise. Pour la petite histoire, ils ne paient pas de moi. I just can't help myself-Google fait toujours des choses cool.
Récemment, Google a indiqué qu'il est maintenant capable d'utiliser la reconnaissance optique des caractères à l'index des documents numérisés stockés au format Adobe PDF. Auparavant, la société docs rarement balayées parce qu'il ne pouvait pas être sûr des résultats de recherche. D'après le blog de Google:
Si nous avons répertorié les documents enregistrés au format PDF depuis un certain temps, les documents scannés sont beaucoup plus difficile pour un ordinateur à lire. La numérisation est l'inverse de l'impression. Impression numérique transforme les mots en un texte sur papier, tandis que la numérisation rend une image numérique de la physique du papier (et texte) pour vous permettre de stocker et de visualiser sur un ordinateur.
Pour prendre une commande d'essai de cette nouvelle chose nouvelle, cliquez sur cette requête de recherche-Steady réussite dans un monde instable, et vous verrez un extrait de la doc PDF dans les résultats de recherche suivie par l'opinion comme des liens HTML.
Convertir des fichiers PDF numérisés en texte
Si vous avez scanné au format PDF sur votre disque dur, mais un logiciel d'OCR le manque, vous pouvez toujours les convertir en texte reconnaissable, DI dit.
Créez un dossier sur votre site Web (par exemple, votre site est abc.com) et envoyer tous vos fichiers PDF dans le même dossier. Ensuite, créez une page Web publique que des liens vers tous les fichiers PDF. Attendez que le searchbots Google pour Spider your stuff. Après cette étape effectuée, tapez site: abc.com / html filetype: pdf pour visualiser vos fichiers PDF au format HTML.
Lifehacker ajoute cette touche de convertir des fichiers PDF au format HTML:
Vous pouvez utiliser Google Outils pour les webmasters à régner dans ce qui sera scanné et indexé sur votre site, bien que vous devez assumer n'importe quoi vous avez mis en ligne peut être trouvé par ceux qui la recherchent.
Pouvez-vous dire ce qui ne va pas avec la peine au-dessus de Lifehacker? Lire "21 Words That Sound semblables, mais signifient des choses différentes." Quel mal dans ce tableau?








