返回首页
用扫描仪输入文字和程序试用记



目录

(按Ctrl-F查找内容)

我曾经建议有的杂志把有程序的文章,收进光盘。
用“汉王OCR==图象处理”V5.1 处理后的文字:
用 “丹青中英文文件辨识系统”V4.0 处理后的文字:
原稿上的文字(《电脑爱好者》2002年第13期114页)
问:PDF 文件转换为TXT 文件,有没有简捷方法?
用扫描仪识别汉字代替手工输入存在的问题。

返回

我曾经建议有的杂志把有程序的文章,收进光盘。

我喜欢《软件》,它使我获益非浅。感谢工作者的辛勤劳动。 你们是否留意,《电脑爱好者》从2000年下半年以来,新开了 一个“程序谷”专栏,把一些VB、VC、Delphi、Js等小程序刊出来, 而且在网站提供下载。使程序迷们欣喜若狂。因而成为大热点吗? 如《软件》200101-64 “网页中下拉导航菜单的制作”、 《软件》200102-60 “在VB6.0 中实现磁盘文件遍历二法及 其对比”, 为什么在光盘里找不到它们的踪影呢? 难道真的要让读者一个字符一个字符往里敲吗?! 不知道您有没有那样的经历。当您把一篇长一点的程序,费尽 九牛二虎之力把最后一个字符敲完的时候,却发现原程序有错,根 本没法调通。那个懊丧劲就别说了。你还有信心再去敲第二篇、第 三篇吗? 我真的不知道要把这些程序收进光盘存在多少困难。 如果我这意见真的被你们采纳,我代表读者特别是程序迷们, 感谢你们了。 hhstone. 后来,我的建议得到编辑的采纳,我真高兴。那是去年的事了。 但是,我的网站上的文章和程序大部分还得用手敲,因此用扫 描仪代替手工输入,一直是我多年的梦想。 当扫描仪的价格降到对我有吸引力的时候,今年我花了七百多 元,买了一台。 要说扫描图像,画面清晰,颜色也很逼真,没有说的。要说输 入文字,要达到和图像一样的程度,还有好长的路要走。 扫描软件是MiraScan 5.0 很不错的。文字识别软件是国内有 名的几家专业软件公司的产品。由于汉字识别的特殊性,也可能是我 操作不熟练的原因,识别效果还不很理想。其中使用效果比较好的, 如:
返回

用“汉王OCR==图象处理”V5.1 处理后的文字:

-k如何把PDF格式文fi:转换为TXT格式文fi:? 答:由于PDF格式文件不能直接转换成TXT文件格 式, 因此只能利用间接转换方式,即可以先用Adobe Acrobat软件将PDF格式文件转换成RTF格式文件(这也 是一种文本格式文件),然后用Word或“记事本”程 序打开该文件,随后另存为TXT格式文件即可。需要注 意的是,经过这样处理后PDF文件里的图片、文字格式 和排版样式都会丢失o ·
返回

用 “丹青中英文文件辨识系统”V4.0 处理后的文字:

请问有没有办法把PDF枯式文件转换为TXT枯式文 件? 答:由于PDF格式文件不能直接转换成TXT文件格 式,因此只能利用间接转换方式,即可以先用Adobe Acrobat软件将PDF格式文件转换成RTF格式文件(这也 是一种文本格式文件),然后用Word或 "记事本"程 序打开该文件,随后另存为TXT格式文件即可。需要注 意的是,经过这样处理后PDF文件里的图片、文字格式 和排版样式都会丢失。
返回

原稿上的文字(《电脑爱好者》2002年第13期114页)

?请问有没有办法把PDF格式文件转换为TXT格式文 件? 答: 由于PDF格式文件不能直接转换成TXT文件格 式, 因此只能利用间接转换方式,即可以先用Adobe Acrobat软件将PDF格式文件转换成RTF格式文件(这也 是一种文本格式文件), 然后用Word或 "记事本"程 序打开该文件,随后另存为TXT格式文件即可。需要注 意的是,经过这样处理后PDF文件里的图片、文字格式 和排版样式都会丢失。
返回

问:PDF 文件转换为TXT 文件,有没有简捷方法?

答:用 AcroReader 5.0 的AcroRD32.exe可以比 较方便地把文字复制过来。但“复制”按钮默认为不可 操作状态,需要配合最后两个按钮“文本选择”和“图 形选择”来使用。在复制文本前,先点击“文本选择” 按钮,再用鼠标选中文本。此时“复制按钮”已变为可 操作状态,全部或部分选择,点击后选中的文本就已经 被复制了。之后我们就可以在其他文本编辑工具中粘贴 使用了。 但由于有些PDF 文件已经加密,如果不解密无法复 制,或者每次只能复制一页,给转换增加了难度。 但技术总是发展的,总会找到解决的办法。 制作PDF 文件的本意,是为了阅读方便,但如果采 用一些处理方法,使得查找、打印、复制、转换反而不 如TXT 文本文件方便,那就有违本意,可能在竞争中失 去优势,业者不可不慎。
返回

用扫描仪识别汉字代替手工输入存在的问题。

从上面两段文字来看,已经可以实用了,这很不简单。 还有误识,尚待改进。 用扫描仪识别汉字代替手工输入从理论上讲是可行的。 而且也取得了初步的成果。但是还存在一些问题: 1、 操作比较麻烦,很多时候都要手工进行预处理,比较 费事。 2、 识别率还不是很高。有些地方还要手工修改。 对程 序文件的识别,误识的还比较多,要是能做到和一些编辑软件 一样,能把一些符合程序语言的语句都用不同的颜色标识出来 那就更好了。 3、 扫描软件和识别软件的衔接还存在问题。 4、 还有没有更简单方便的办法, 一边扫描一边读出 文稿,生成文本文件,或者HTML 等格式文件,中间不再需要 手工干预。 我们寄希望于从事这项工作的软硬件业者。 河石/编 2002.8.1 相关链接: 《在多文件中查找文字的详细列表方法》 《网络词典--快速查英语缩略词》 《电脑资料--快速查电脑资料》
黄河之滨 网站:http://hhstone.vip.sina.com, http://www.hhstone.com
返回首页返回最上面