你得知道PDF文件生来就不是为了让人方便编辑的,它的主要目的就是固定住排版,让任何人在任何设备上打开看起来都一样,想把PDF完美地转成可以随意修改的Word文档,本身就是个有点挑战的事儿,不存在一个魔法按钮能100%保证所有文件都原封不动地转换成功,尤其是那些带复杂表格、特殊字体或者像简历、设计稿一样排版精致的文件,用对方法和工具,你能得到非常接近原样的Word文档,大大减少手动调整的时间。
最直接也最常用的方法就是使用专业的转换软件或在线工具,现在很多软件都做得不错,比如Adobe Acrobat Pro DC,这是PDF的亲爹做的,转换效果通常最靠谱,如果你经常需要处理这个,投资一个正版是值得的,它的操作很简单,用Acrobat打开PDF文件,点击右侧的“导出PDF”工具,然后选择“Microsoft Word”作为输出格式,再点“导出”就行了,它会尽力保留你的字体、图片、表格甚至页眉页脚。
除了Adobe,市面上还有很多其他的选择,比如万兴PDF(PDFelement)、福昕PDF编辑器等,它们的功能类似,转换效果也相当不错,而且价格可能更友好一些,这些工具的好处是它们专门为处理PDF而生,对格式的解析能力比一般的在线工具要强。
如果你不想花钱买软件,免费的在线转换网站是个不错的选择,比如Smallpdf、iLovePDF、PDF24这些网站,都非常有名,你只需要打开网站,把PDF文件拖拽上传,选择转换成Word格式,等它处理完再下载下来就可以了,这种方法特别适合偶尔转换一下、文件内容不涉密的用户,但要注意几点:第一,免费版本通常有文件大小限制,比如只能转换小于15M的文件;第二,需要联网,如果你的文件很大,上传和下载会比较耗时;第三,也是最重要的,如果你的文件包含敏感信息,要谨慎使用在线工具,因为你的文件会上传到别人的服务器上,有隐私泄露的风险。
还有一个很多人不知道但非常强大的免费工具,就是微软Word自己,用比较新版本的Word(比如Office 2013及以后版本),你完全可以直接打开PDF文件,方法是:打开Word,点击“文件”->“打开”,然后选择你的PDF文件,Word会提示你它会进行转换,点击“确定”就行,Word会尽它最大的努力把PDF内容解析成可编辑的格式,对于文字为主的、排版不太复杂的PDF,这个方法效果出奇的好,而且因为是本地操作,速度快且安全,但对于扫描成的图片PDF或者排版复杂的,效果就可能不太理想。

无论你用哪种方法转换,得到的Word文档都很少是完美无缺的,几乎都需要进行一些手动调整,这就到了“保留原样编辑与排版”的关键技巧部分了,转换后第一件要做的事就是仔细检查全文,重点关注以下几个最容易出问题的地方:
字体问题是最常见的,PDF里用的特殊字体,如果你的电脑上没有安装,Word就会用默认字体(通常是宋体或等线)替代,版式就可能错乱,解决方法是,要么在你的电脑上安装原PDF使用的字体(如果找得到的话),要么就在Word里重新选择一种相似的字体统一替换,可以按Ctrl+A全选文字,然后统一设置一种常用字体。
图片和表格也是重灾区,转换后图片可能会错位,或者背景出现不该有的黑框白边,表格可能会散架,单元格合并或拆分出错,这时候你需要耐心地手动调整,对于图片,右键点击选择“大小和位置”进行微调;对于表格,利用Word的表格工具“布局”选项卡,重新合并或拆分单元格,调整行高列宽。

页眉、页脚和页码也要仔细核对,有时候转换后这些元素会消失,或者跑到正文里,你需要进入Word的页眉页脚编辑模式,重新添加或调整,分栏排版也可能被打乱,你需要选中相关段落,在“布局”菜单中找到“栏”选项,重新设置为合适的分栏。
还有一个高级技巧是使用Word的“样式”,转换后的文档通常样式会很混乱,你可以利用Word的“样式”窗格(在“开始”选项卡里),统一修改“标题1”、“标题2”、“正文”等样式的格式,这样做的好处是,你只需要改一次样式,所有应用了这个样式的文字都会自动更新,比一段一段去修改效率高得多。
处理由扫描件或图片生成的PDF(也就是图片型PDF)是最麻烦的,上面提到的所有方法对这类PDF基本无效,因为它们本质上就是一张张图片,对付这种文件,你必须使用带OCR(光学字符识别)功能的工具,无论是专业的Adobe Acrobat、万兴PDF,还是一些在线的转换工具,都会有这个选项,OCR功能能识别图片中的文字,把它变成可编辑的文本,转换前,务必确保你勾选了OCR选项,并正确选择文档的语言(如中文、英文),这样识别准确率才会高,即使使用了OCR,转换后也一定要逐字逐句检查,因为识别错误是常有的事。
快速转换PDF到Word并尽量保留原样的核心就是:选对合适的工具(专业软件、在线工具或Word自身),然后做好手动微调的心理准备,重点检查字体、图片、表格、页眉页脚等关键元素,善用Word的样式功能来提高调整效率,对于扫描件,则必须依赖OCR技术,多尝试几种方法,你就能找到最适合自己需求的高效工作流程。