tntxhy 2007-7-2 15:17
版权声明:转载本站原创作品时请务必标明以下文章作者和原始出处信息。
作者:tntxhy @ http://bbs.napolun.com
原始出处:http://www.napolun.com/Acrobat+8+Professional+%E7%9A%84OCR%E5%8A%9F%E8%83%BD%E4%B8%8D%E9%94%99/tid-25291.html
Adobe Acrobat 8 Professional内置了OCR功能,直接能够将图片格式的文字识别为文字格式,对英文的支持很不错,中文没有测试。
FTP上Osprey的书可以都转成英文文本了:)能够节省一半的空间。
tntxhy 2007-7-2 15:57
优化功能也不错,还可以再压缩一半到三分之二的空间:lol
白星逐日 2007-12-13 04:27
引用:
原帖由 tntxhy 于 2007-7-2 15:17 发表 
Adobe Acrobat 8 Professional内置了OCR功能,直接能够将图片格式的文字识别为文字格式,对英文的支持很不错,中文没有测试。
FTP上Osprey的书可以都转成英文文本了:)能够节省一半的空间。
用Acrobat 7的OCR测试了一下《帝国刺刀》,结果搞得一塌糊涂。会错行,读错字,尤其是图片的注解,稍微模糊一点就不行了。
fnietzsche 2008-2-6 02:14
用过了,不是太好用啊
guqi5 2008-2-27 12:55
我想问下:Adobe Reader内置了OCR功能吗?怎么我在用Adobe Reader 8的时候不能直接将图片格式的文字识别为文字格式呢?
guqi5 2008-3-28 16:04
刚刚下载了Adobe Acrobat 8 Professional,想简化现有的OSPREY书籍,里面的OCR功能不太会用啊,用过之后文字倒是可以复制了,但是图片却无法识别了
蓝色拿破仑 2008-3-31 09:12
PDF先将图片提取,然后剪裁。
OCR英文然后图文混排。
不过这样做一本书就要好长时间.
guqi5 2008-3-31 12:09
啊?这么麻烦,还要把PDF中的图片一张一张剪切出去,然后对剩下的纯文字进行光学识别,最后还要把剪切出去的图片再粘贴回原处,一本书有90多页,估计一页得做几分钟,而且文字识别的效果也不敢保证,很麻烦啊。我记得OCR识别文本对话框中有个叫格式化的文本和图形的选项,可以同时识别图片和文本,不过准确性很差,识别出的图片要么比原图大,要么比原图小,而且还会更改原图颜色,搞得整张页面面目全非,可能是我还不会用吧
蓝色拿破仑 2008-3-31 12:15
资源库有专门的pdf图片提取工具。只是纯图片部分还是要剪切。
guqi5 2008-3-31 12:58
刚试了一下,剪切为单独的PDF文件,但不知如何粘贴覆盖回原处:yct57:
guqi5 2008-3-31 13:11
哦,这样就方便多了,不用再剪切来剪切去的了,不过难道Acrobat 8自身没有精确识别图片的功能吗?
guqi5 2008-3-31 13:18
刚才下载后用了一下,因为原文件97页全是jpg格式的,所以提取后还是包括了文字,看来得先ocr一下,把文字先识别出来,再用此工具才能提取纯图片
蓝色拿破仑 2008-3-31 13:28
先OCR文字,复制到word
再提取整个页面的图片,然后利用ACDSEE剪裁图片。
最后图文混排……很麻烦。做一页试试看。
蓝色拿破仑 2008-3-31 13:40
word里啊……
:tuzki1
原书什么样,就做成什么样。
蓝色拿破仑 2008-3-31 14:08
当然这就从影印pdf转换成了文本pdf。应该说更方便。
在word里编排好直接用adobe profeesional7.0以上编辑软件转换合并即可。当然不要忘了制作书签。