Nueva consultable escaneadas de documentos y un tornillo común, hasta
5 de enero 2009 por Michael Alexander · Deja tu comentario
Buzz This Post
Digg this post
Reddit
Stumble This Post
Menciono G oogle tan a menudo que mucha gente debe pensar que estoy pagando por la empresa. Sólo para que conste, no me pagan. Simplemente no puedo ayudarme a mí mismo, Google siempre está haciendo cosas muy interesantes.
Recientemente, Google dijo que ahora es capaz de utilizar el reconocimiento óptico de caracteres para indexar documentos escaneados almacenados como archivos PDF de Adobe. Anteriormente, la compañía raramente documentos escaneados, ya que no podía estar seguro de los resultados de búsqueda. Según el blog de Google:
Si bien hemos indexado documentos guardados como archivos PDF, desde hace algún tiempo, los documentos digitalizados son mucho más difícil para una computadora para leer. La exploración es el reverso de la impresión. Impresión digital convierte las palabras en un texto en papel, durante la exploración hace una fotografía digital del documento físico (y texto) para que pueda almacenar y visualizar en un ordenador.
Para hacer una prueba de conducción de esta nueva cosa nueva, haga clic en esta consulta de búsqueda constante de éxito en un mundo volátil y verás un extracto del documento PDF en los resultados de búsqueda seguido por el vínculo Visualizar como HTML.
Convertir archivos PDF escaneados en texto
Tech sitio Digital Inspiration tiene un ángulo de esta nueva característica vale la pena mencionar:
Si usted tiene archivos digitalizados en formato PDF en su disco duro pero el software de OCR, puede convertirlo en texto reconocible, DI, dice.
Cree una carpeta en su sitio web (por ejemplo, su sitio es abc.com) y cargar todos sus archivos PDF en la misma carpeta. A continuación, cree una página web pública que une a todos los archivos PDF. Espere a que la araña de Robots de búsqueda de Google para tus cosas. Después de que se haga, escriba "site: abc.com / pdf filetype: pdf para ver sus archivos PDF como HTML.
Lifehacker agrega este giro a la conversión de archivos PDF a HTML:
Usted puede utilizar para webmasters de Google Herramientas para reinar en lo que se escanean y indexadas en su sitio, aunque se debe asumir todo lo que puso en línea pueden ser encontrados por aquellos que buscan para ello.
¿Puedes decirme qué hay de malo con la sentencia de Lifehacker de arriba? Leer "21 palabras que suenan igual pero significan cosas diferentes." Lo malo en esta imagen?








