教程博客

新的搜索的扫描文件和共同搞砸




我提到摹 oogle经常有很多人一定认为我是让公司支付。 为了记录,他们不付我。 我不能帮助自己,谷歌始终做很酷的事情。

最近,谷歌表示,现在可以使用光学字符识别索引的Adobe PDF文件存储扫描的文档。 此前,该公司很少扫描文档,因为它无法在搜索结果的肯定。 根据谷歌的博客:

虽然我们已经编制索引了一段时间,PDF文件保存的文档,扫描文件是更大量的计算机难以阅读。 扫描印刷的相反。 印刷文本转换成数字文字在纸面上,而扫描作出的物理文件(数码图片和文字),这样你就可以存储并查看在电脑上。

承担这项搜索查询, 取得稳定的这一新新事物的测试驱动器,单击在变化无常的世界中 ,你会看到一个在为HTML的链接查看随后的搜索结果PDF文档摘录

文本转换扫描PDF文件

数码科技的网站上有一个启示值得一提的这个新功能的角度:

如果您有PDF格式的硬盘驱动器,但缺乏OCR软件扫描的文件,你仍然可以识别的文字转换成他们,直接说。

创建一个文件夹在您的网站(例如,您的网站是abc.com)和所有的PDF文件上传到同一文件夹。 然后,创建一个公开网页,链接到所有的PDF文件。 等待谷歌searchbots的蜘蛛你的东西。 经过这样做了, 输入site:abc.com / PDF格式档案类型:pdf为HTML看到您的PDF。

Lifehacker的添加此转折转换为HTML PDF文件

您可以使用谷歌的网站管理员工具中得到什么扫描并在您的网站索引的统治,虽然你应该承担什么你将可以通过网上寻找它的发现。

你们能告诉我的错Lifehacker的的上述? 阅读“21条相同方式声词一句, 但不同的解释。”在此图片是什么错?

哎呀



评论已经关闭。

教程博客