西西河

主题:【问个问题】有什么软件能把pdf转成文档吗? -- 月色溶溶

共:💬43 🌺8 新:
全看分页树展 · 主题 跟帖
家园 刚刚用我以前的中英文/拉丁文混排表格测试了,花之

简单测试了一下,就综合性能来说,远高于我所用的汉王版本(8.1.0.3),可能我以前主要把目光放在国内几家厂商了,或者比较依赖一些固定思维而错过了这个不错的软件。

主要有以下几个方面的对比:

1.单纯的字符识别率

这个都不错,就我的测试文档来看,finereader略高一点,

但这个可能跟具体文档有关,属个体差异。

2.语言混排识别

汉王只有简单的中英文,可选模式只有三种(简,简繁,英)。

FR支持N种语言,甚至包括编程语言。既可以简单的选择语言,又可以在语言管理器里自己个性化配置进行语言组合。这个对于批量长期用户非常有用,比如针对我手上某文件,我自定义配置语言为(简,英,拉丁),以后遇到同类的文件,只要读取配置即可。

FR支持语言种类多,可自定义,组合模式下,识别率高,完胜。

3.综合排版分析和输出格式

汉王有简单的排版分析能力,支持的输出格式基本够用,但细节做的不太好,比如输出的文本不带格式和样式,比如识别的表格直接输出为excel时,多余的换行符,空格,再后期校对处理时十分烦琐。

FR支持文件格式齐全,并且文字可以带格式输出(字体,字号,黑体,斜体),当然也包括表格的输出。并尽量保持最后输出的格式与原图片的结构相似性。这些虽然是细节,但恰恰是用户的最终需要,极大提高了自动程度,减少了用户的后期工作。

FR完胜。

4.设计理念及人性化

这个其实是是最重要的,放在最后

尽管我接触这个FR软件只有几个小时,但从安装起,就觉得功能强大而人性化,快速任务,智能错误提示,校对界面等都是从用户完成任务角度出发的,感觉十分贴心。

可以说FR的设计理念,就是向着自动化的多语言pdf(图片)转电子文档整体解决方案这个目标努力的。

而汉王似乎没到这个高度,只能算一个还算好用的OCR软件。

可以说,存在代差,FR完胜。

这些其实从软件安装后的文件夹大小就能看出,两款软件的目标是不同的。汉王安装完成后50M不到,FR我只选了4种语言,就达到了近350M。

总结,我的测试仅是针对手头有限的几个印刷体混排文档扫描件

仅针对所用的两款软件分别是汉王 pdf OCR 8.1.0.3和ABBYY Finereader9.0 企业版,当然,都是花差花差地。

没有测试手写中文(估计这个汉王应该是强项)和最新版本。

我只是短时间使用,有局限性,仅供大家参考。


本帖一共被 1 帖 引用 (帖内工具实现)
全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河