全局通栏广告

爱盲论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 670|回复: 3
打印 上一主题 下一主题

使用ABBYY实现单文件转换,合并转换,以及批量转换PDF文件的方法

[复制链接]

53

主题

266

帖子

773

积分

中级会员

Rank: 3Rank: 3

积分
773
跳转到指定楼层
楼主
发表于 2023-11-8 11:03:01 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
楼主 智慧西瓜说:
上篇文章我们介绍了使用微软的Microsoft Edge浏览器阅读和处理pdf文件的方法。但需要注意的是,使用浏览器仅能阅读文字转换后的pdf文件,如果遇到图片形式的pdf文件,使用浏览器无法阅读到其中的内容。读屏软件仅会给予“图片”或“图形”的提示。对于这类pdf文件,可以使用Abbyy进行处理。
Abbyy FineReader是一款非常优秀的pdf转换工具,其不仅能转换图片形式的pdf文件,常用的文字版pdf也可以轻松转换。该软件具有以下几个优点。第一,操作基本无障碍,软件设置和常用功能都可以用读屏软件操作;第二,常用的pdf转换功能的操作逻辑非常简单,即使是电脑初学者也可以迅速学会使用方法;第三,转换后的文字、表格的格式信息保持的几乎与图片一致。有很多pdf转换工具转换后文字和表格的格式会发生错乱,Abbyy转换后格式基本上与源文件保持一致,节省了我们整理文字格式的时间。下面我们逐个介绍其常用功能。
1.        设置:使用前,我们需要先进行一些重要设置。在桌面上回车打开Abbyy,按alt加t打开“工具菜单”,上光标找到“选项”回车进入。首先显示的是常规选项。这里有两个需要设置的项目。第一,打开软件时打开新OCR项目或打开上次使用的OCR项目,我们按tab可以切换到一个单选框,用上下光标选择我们需要的选项。第二,是否将该软件设置为pdf的默认打开工具,我们按tab切换到“设为默认项”在此处空格即可切换选项状态;
接下来,我们进行图像处理设置。按tab找到“常规”按钮处,按右光标切换到图像处理选项卡,这里有三个比较重要的设置项。第一是“背景识别”,我们要按空格将其选中,这样在浏览一些仅有图片没有文档内容的页面时,仍然可以识别出图片中的文字信息。第二是语言选项,这里我们需要用模拟鼠标功能进入。可以使用读屏软件的快捷键将鼠标移动到焦点所在位置,然后单击即可进入。进入后我们可以浏览到一个树视图,在其中我们主要需要关注两类项目,一类是自然语言,另一类是正式语言。自然语言中列举了不同国家和地区的语言,我们可以按需选择。如果识别的文档全部为英文,我们只需要勾选英语即可,可以获得更好的识别效果。如果仅识别中文内容,只选择简体中文即可。通常情况下我们识别最多的是中文和英文混排的内容,因此应同时选择简体中文和英语两种语言;正是语言中,我们可以选择我们需要识别的语言类型。比如我们识别的文档包含编程代码,可以选中对应的“C/C++”或“java”等编程语言选项,程序会对文档内容进行特别优化处理,从而获得最佳的识别效果。正是语言中还包括数学公式和化学式的选项,如果文档中包括这些内容,可以将其勾选,这样可以保证公式部分有更高的识别准确率。设置完语言后,我们继续按tab,可以找到一个“拆分对开页”的选项,我们需要按空格将其选中。这样在遇到一页中包含左右两页内容时,程序会分别识别左右两页,而不会将其混在一起识别;
2.        Pdf转word:将pdf文件转换成方便阅读和编辑的word文档是我们最常使用的功能。很多视障用户喜欢将pdf文件转换成txt文档,但由于txt无法显示图片、表格等信息,会使pdf文件部分内容和格式信息丢失。因此,首选将pdf文件转换成word文档。该功能的操作方法也很简单,在电脑上找到一个需要转换的pdf文件,按菜单键打开菜单,按下光标找到“使用ABBYY FineReader转换”,按右光标展开子菜单,继续按下光标找到“转换为Microsoft Word文档”回车进入。此时会弹出一个另存文档的对话框,我们首先选择转换后的文档保存位置,随后按tab可以找到一个打开文件的复选框,这是设置转换后是否打开文件的选项。勾选后转换完成会自动打开转换后的文档,反之则不会打开。继续按tab可以找到一个设置语言的对话框,这里可以选择该文档的转换语言。继续按tab可以切换到选项按钮,空格打开后有一些更详细的设置,大家可以按需选择。设置完毕后点击保存,文档就开始转换了,转换完成后,默认会自动打开刚刚转换的word文档,我们可以自由的阅读和编辑文档内容。
3.        批量转换pdf文件:有时候我们需要转换多个pdf文件,逐个转换非常浪费时间。此时我们可以在电脑上同时选中需要转换的pdf文件,按菜单键打开菜单,下光标找到“使用ABBYY FineReader转换”,按右光标展开子菜单,继续按下光标找到“转换为Microsoft Word文档”回车进入。此时弹出一个对话框,我们点击“转换为Word”,此时会打开选择文件夹界面,我们选择需要保存的文件夹后,tab键找到“选择文件夹”回车即可开始转换。
4.        文件合并:包括合并为pdf文件以及合并为word文档两种情况。合并为PDF文件操作方法很简单,同时选中需要合并的pdf文件,按菜单键,下光标找到“组合进一个PDF”,在弹出的新界面中点击“转换为 PDF”即可;合并为word文档的操作方法与转换单个文档类似,选中需要转换的pdf文件后,在菜单中选择转换为Microsoft Word文档,在弹出的界面中勾选“将所有文件合并为一个文档”,继续点击“转换为Word”即可。
5.        Pdf转其他格式:找到需要转换的pdf文件,按菜单键打开菜单,按下光标找到“使用ABBYY FineReader转换”,按右光标展开子菜单,继续按下光标找到“转换为其它格式”回车进入。此时会打开保存文件对话框,在保存类型处我们可以选择txt、rtf、excel等常用格式,选择完毕后点击保存文档就开始转换了。
6.        文本转pdf:在有些场景下,我们不希望文档在传播过程中内容和格式发生改变,就可以将其转换为pdf文件。方法很简单,在电脑上找到需要转换的pdf文档,按菜单键打开菜单,按下光标找到“转换为pdf”回车进入。此时会弹出一个另存文件的对话框,我们选择保存位置和保存格式后,点击保存按钮,文档就开始转换了。
7.         扫描文档:有时候我们需要的资料没有电子版,需要将纸质版扫描成电子版,也可以使用该软件操作。打开Abbyy后,按alt加v打开查看菜单,按下光标找到扫描回车进入。此处有几个选项。扫描至OCR编辑器,可以将文档扫描后直接进行编辑;扫描到PDF,扫描后直接将文档内容创建为一个pdf文件;扫描到Microsoft Word,将扫描后的内容直接转换成word文档;扫描到Microsoft Excel,扫描后直接将内容转换为excel文件,该选项在扫描表格内容时非常实用,可以尽可能的保持扫描后表格的原本格式;扫描到图像文件,扫描后会生成一个图片形式的pdf文件;扫描到其他格式,可以选择我们常用的其他格式,如txt、rtf等。
以上就是本文介绍的全部内容。大家有哪些关于本软件的其他使用方法也欢迎在文后留言讨论,下篇我们将继续为大家介绍阅读和处理pdf文件的其他方法,敬请期待!
更多实用的视障经验,更多新奇好物分享,欢迎大家专注微信公众号“西瓜无障碍”,我们每周一篇精华文章,咱们下周不见不散!
本帖来自爱盲客户端
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏
回复

使用道具 举报

16

主题

227

帖子

3597

积分

高级会员

Rank: 4

积分
3597
沙发
发表于 2023-11-8 11:39:37 | 只看该作者
<
沙发 小熊说:回复楼主智慧西瓜
很好的教程!
本帖来自微秘
回复 支持 反对

使用道具 举报

3

主题

147

帖子

531

积分

中级会员

Rank: 3Rank: 3

积分
531
板凳
发表于 2023-11-9 19:52:01 | 只看该作者
<
板凳 童年.说:回复楼主智慧西瓜
想问win7用不了这个软件吗
本帖来自微秘
回复 支持 反对

使用道具 举报

385

主题

4309

帖子

1万

积分

金牌会员

Rank: 5Rank: 5

积分
10510
地板
发表于 2023-11-9 19:54:03 | 只看该作者
<
地板 月亮雨说:回复楼主智慧西瓜
支持
本帖来自微秘
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋| 爱盲论坛  

GMT+8, 2024-11-6 23:22 , Processed in 0.060233 second(s), 26 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表