搜索
楼主: eikc

提一个建议━━将PDF文件转化为文本文件

[复制链接]
发表于 2004-12-23 10:20 | 显示全部楼层

关于OCR

可以用清华的th-ocr9.0
我感觉不错,如要的话给我发信
金币:
奖励:
热心:
注册时间:
2004-12-21

回复 使用道具 举报

发表于 2004-12-23 13:43 | 显示全部楼层
Originally posted by hxf771130 at 2004-12-23 10:20
可以用清华的th-ocr9.0
我感觉不错,如要的话给我发信

hxf771130兄:
我需要试一试这个软件,能提供下载地址吗?
谢谢
金币:
奖励:
热心:
注册时间:
2002-5-18

回复 使用道具 举报

发表于 2004-12-23 19:51 | 显示全部楼层

尚书6.0或7.0(ocr)非常不错........

它的识别率非常高,只要你的扫描质量好,几乎可达100%,我已经使用4年多了。大家可用搜索功能很快找到它。
金币:
奖励:
热心:
注册时间:
2003-7-21

回复 使用道具 举报

发表于 2004-12-23 20:06 | 显示全部楼层

遇到比较好的PDF内容,手中又没有这些资料时........

先在电脑上打开PDF文件,边选定需要的内容,边制作尚书6.0能识别的图形文件。如果原文扫描质量较好,可一次完成,如果质量差一点,还要对图形文件作加工处理,尚书6.0都能识别,如果质量太差,就不能制作图形文件。虽然看起来很麻烦,但比手工打字快得多。
金币:
奖励:
热心:
注册时间:
2003-7-21

回复 使用道具 举报

发表于 2004-12-23 20:13 | 显示全部楼层
超星的PDG格式ORC识别转换还行,其他的辩识率太差了

主要是原文扫描质量差的原因,Adobe Acrobat Professional 6.0复制的TXT文件内容都是乱码。
金币:
奖励:
热心:
注册时间:
2003-7-21

回复 使用道具 举报

发表于 2004-12-24 02:09 | 显示全部楼层
我感觉 文通慧视 好,直接在屏幕截取并识别,而且识别率很高。
金币:
奖励:
热心:
注册时间:
2001-12-26

回复 使用道具 举报

发表于 2004-12-24 11:23 | 显示全部楼层

清华文通慧视小灵鼠 正式版及破解

金币:
奖励:
热心:
注册时间:
2003-7-21

回复 使用道具 举报

发表于 2004-12-24 11:25 | 显示全部楼层

巧用“文通慧视视觉图像文字识别软件”抓网页

金币:
奖励:
热心:
注册时间:
2003-7-21

回复 使用道具 举报

发表于 2004-12-24 11:33 | 显示全部楼层
我感觉 文通慧视 好,直接在屏幕截取并识别,而且识别率很高。

由于许多扫描仪是与识别软件捆扎在一起销售,因此还要看你使用什么扫描仪,因为软件与扫描仪之间有一个兼容的问题。当然你如果用来作屏幕截取又另当别论。
金币:
奖励:
热心:
注册时间:
2003-7-21

回复 使用道具 举报

发表于 2004-12-24 13:06 | 显示全部楼层

如果需要识别的资料扫描质量伐值不够,文通慧视也是不行的..........

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
金币:
奖励:
热心:
注册时间:
2003-7-21

回复 使用道具 举报

发表于 2004-12-24 13:06 | 显示全部楼层

2

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
金币:
奖励:
热心:
注册时间:
2003-7-21

回复 使用道具 举报

发表于 2004-12-24 13:07 | 显示全部楼层

3、看!有许多不识别......

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
金币:
奖励:
热心:
注册时间:
2003-7-21

回复 使用道具 举报

发表于 2004-12-24 21:31 | 显示全部楼层
最好的OCR就是office2003自带的,基本上没有错误。
金币:
奖励:
热心:
注册时间:
2004-12-24

回复 使用道具 举报

 楼主| 发表于 2004-12-25 10:09 | 显示全部楼层
Originally posted by T-K at 2004-12-24 21:31
最好的OCR就是office2003自带的,基本上没有错误。


我嫌组件太大没有安装,不过上面介绍的软件也不错了,减轻了很多工作量。
金币:
奖励:
热心:
注册时间:
2001-12-4

回复 使用道具 举报

发表于 2004-12-25 19:03 | 显示全部楼层

扫描小精灵ver1.30

这是一个很好的软件,已经使用多年了,可以兼容各种扫描仪,大家可以试用。我主要用它扫描大厚本的书,基本上1分钟可以扫描A4幅面1张,1本300多页的书最多半天就可以扫描完,然后用识别软件集中识别,功效还是很高的。目前扫描仪比较便宜,不到400元。
金币:
奖励:
热心:
注册时间:
2003-7-21

回复 使用道具 举报

发表于 2004-12-25 19:04 | 显示全部楼层

对不起.....

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
金币:
奖励:
热心:
注册时间:
2003-7-21

回复 使用道具 举报

发表于 2004-12-27 00:02 | 显示全部楼层
PDF转换成TXT的确会有很多阅读麻烦,不过acrobat可以将PDF直接转换成WORD,但acrobat reader 版本就不能了,我们大家平时阅读PDF文档的程序基本是acrobat reader版本
金币:
奖励:
热心:
注册时间:
2004-1-1

回复 使用道具 举报

发表于 2004-12-27 09:50 | 显示全部楼层

gan dong

金币:
奖励:
热心:
注册时间:
2003-3-9

回复 使用道具 举报

发表于 2006-6-3 10:35 | 显示全部楼层
非常感谢。真的。谢谢。
金币:
奖励:
热心:
注册时间:
2006-6-3

回复 使用道具 举报

发表于 2006-6-3 10:40 | 显示全部楼层
支持TXT化!
金币:
奖励:
热心:
注册时间:
2005-12-28

回复 使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

本站声明:MACD仅提供交流平台,请交流人员遵守法律法规。
值班电话:18209240771   微信:35550268

QQ|举报|意见反馈|手机版|MACD论坛

GMT+8, 2026-2-8 01:50 , Processed in 0.056136 second(s), 11 queries , MemCached On.

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表