西西河

主题:【问个问题】有什么软件能把pdf转成文档吗? -- 月色溶溶

共:💬43 🌺8 新:
全看分页树展 · 主题 跟帖
家园 图片用OCR,文字直接选定,复制,粘贴

我平时工作中有时用到,说点我的经验

因为pdf可以包含很多种对象(字符,图片,声音等),所以不能一概而论。

你可以用编辑器,官方的第三方的都可以,打开看看。

1.如果是把整页文档作为一个图片存储的(这种多半是实体文稿扫描件),需要用OCR软件识别。

2.如果你能够选中里面的一些字符,那应该是电子格式直接生成的pdf文档,一般是word,excel及其他文字表格编辑软件通过官方工具以及pdf虚拟打印机生成的。

1中文件会比较大,单页数百k,2中的文件通常较小,几十k。

对于1.要用OCR软件

OCR软件,我推荐汉王pdf ocr,我用的是8.1

感觉很不错,支持表格,支持中英文简繁体混排,识别率还可以

前段时间刚处理了一个10多页的xx产品表,包括种类,序号,英文名,拉丁名,品种的判断,特性,用途,繁体中文的。

我是先识别成文本文件(txt),然后粘贴到excel里处理

字符识别率还是很高的,只是制表符位置,还有空格

需要在excel里用点查找替换的小技巧处理下

当然,校对和人工编辑都是难免的必要的,没法唰的一下完成。

对于2. 可以直接复制粘贴出来

刚看了子明介绍的Abbyy Finereader,试了一下,果然好

比我手头上现用的这个版的汉王好很多,在此强烈推荐。我的具体不完全评测可看我的回复zzbzerg:刚刚用我以前的中英文/拉丁文混排表格测试了,花之

友情提示:汉王pdf ocr功能有限,体格小巧,约50M

FR功能强大,体积自然.....约300M

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河