无障碍优秀，如何使用手机版白描识别图片和pdf文件

智慧西瓜 · 发表于 2023-12-11 07:01:35

楼主智慧西瓜说：
白描是一款非常优秀的文字识别工具，可以帮助我们将图片和pdf中的文字提取出来进行阅读和编辑。之前我们介绍过白描桌面版识别图片和pdf文件的操作方法。大家可以在公众号回看。相比桌面版软件，手机版白描的功能更加强大，除支持图片和pdf文件的识别外，还增加了图片翻译、扫描文件、拍照识别、制作身份证扫描件以及利用siri快速识别等功能。下面为大家逐一进行介绍。需要注意的是，本文基于白描iOS版撰写，安卓版的操作与之类似，大家可以对照本文探索一下操作方法。
1. 识别图片。这是白描的主打功能，也是笔者经常使用的功能。在日常生活和工作中，经常会遇到很多图片文件，比如群内的通知、购物软件中的商品介绍等。此时就可以借助白描进行识别。很多人可能有疑问，现在iOS系统的旁白以及我们常用的微信等工具都有文字识别功能，为何还要用白描进行识别。这里就体现了白描的专业性。白描具有识别速度快、准确率高、排版与原文高度统一等特点。对于视障人士来说，识别图片最关键的是识别的准确率，这方面经过笔者对比测试，白描识别后的准确率仍有一定优势。并且其识别后的文字与图片上原有的格式基本一致，方便用户后续的编辑和排版。
操作时，我们首先将需要识别的图片保存到相册，然后打开白描，手指触摸屏幕左下角，可以找到一个“图片”的提示，双击选中。此时屏幕上按照时间倒序列出了相册中的所有图片，即刚刚保存的照片位于屏幕最上方。用手指触摸屏幕左上方，可以找到“照片1”的提示，同时旁白会读出图片的拍摄日期。如果使用最新版系统，旁白还会读出图片中文字的大致内容，可以帮助我们确认是否是要识别的图片。确认无误后，双击该图片可进入识别选项界面。
在打开的界面上用左右滑动手势浏览，首先可以找到一个“文字”的按钮，点击后可以选择识别的内容类型。包括文字、竖排文字、表格和自由选区。自由选区是通过手指框选需要识别的区域，这个功能视障用户操作起来有一定困难。常用的是“文字”和“表格”两个选项。如果不知道要识别的图片中是什么内容，直接选文字即可。如果明确知道图片中是表格，就选择“表格”选项。继续向右滑动，可以找到“中英文”的按钮。点击后可以选择识别内容的语言。正确选择语言可以提高识别的准确率。日常生活中，多数用户最常使用的是中文和英文，选择默认即可。点击该按钮可以看到法语、德语、韩语等选项，大家根据图片内容的语言进行选择。如果经常有多语言识别的需求，也可以选择“自动检测”，白描会自动为我们选择识别语言。继续向右滑动可以切换到“导出”按钮。点击后可以浏览到三个选项，分别是“导出为pdf文件”、“保存到相册”和“分享图片”。继续向右滑动可以切换到“色彩”的选项，点击后可以对页面图文色彩进行设置，包括彩色文档瑞丽、彩色文档柔和、黑白文档等选项。继续向右滑动可以切换到“文字识别”的选项，双击后进入识别结果界面。
该界面上有一个编辑框，其中的文字就是识别后的结果。从编辑框继续向右滑动，可以切换到复制按钮，点击后可将编辑框中的文字复制到剪贴板。继续向右滑动可以浏览到复制并打开的按钮，点击后会先将识别后的文字复制到剪贴板，然后弹出要打开的菜单，里面可以添加常用的app，比如微信、QQ等。点击对应的app可以前往该应用。继续向右滑动可以切换到“导出“的按钮，点击后可以选择导出为docx或txt文件。点击相应格式后会弹出一个界面，可以浏览到一个以年月日开头的项目，这是分享后的文件名，点击后可以修改。继续点击分享按钮可以将识别后的文字以文档的形式分享到其他app。
如果一次需要识别多张图片，可以使用白描的批量识别功能。在图片选择界面长按某张图片，可启用图片多选功能。左右滑动找到需要识别的图片双击选中，一次可以选取多张图片，选择完毕后可在页面右下角找到一个以图片数量命名的按钮。比如选择了三张图片，按钮的名称为“三”，点击该按钮后即进入了识别选项界面，操作方法同上。
2. Pdf文件转换。手机中的pdf文件最主要有两个来源。一个是存储在手机文件中的pdf文件，另一个是从其他应用中获取的文件。这两个来源的文件识别流程略有区别。如果要识别手机中的pdf文件，可以打开白描，点击页面左下角的“图片”，随后点击页面右上角的“更多功能”，在弹出的菜单中选择“pdf文件识别转换”。此时会打开苹果手机的文件应用，在其中可以选择需要识别的文件，双击即可导入白描；如果是从其他应用中获取的pdf文件，可以打开文件后，从菜单中选择用其他应用打开，再选择白描进行识别。
以最常用的微信为例。在聊天对话框找到一个pdf文件，打开后在页面的右上角找到“更多”按钮，点击后在弹出的菜单中点击“用其他应用打开”，在弹出的应用列表中选择白描，继续在弹出的页面上点击“进入白描转换pdf文件”。应用会提示处理中，稍等片刻后会弹出一个界面，程序会将pdf的每一页拆分成一张照片显示在该界面上。如果只是想转换pdf，可以点击屏幕右下角的文字识别，点击后程序会逐页进行识别，识别完成后右下角的标签名称会变为“查看识别结果”。
利用滑动手势可以浏览屏幕上的每张图片，点击图片可以进入查看每页的识别结果。这里的识别结果是按照图片原有的格式进行排版，使用左右滑动的手势可以在上一行和下一行文字之间切换。如果想导出该页面的识别结果，可以点击“导出”，这里提供了很多导出选项。比较常用的是“导出当前页面为pdf文件”或“保存当前图片到相册”，可根据实际需要进行选择。如果想复制该页面的识别结果，可以点击“去文字查看界面”，进入后点击复制按钮，可将该页面的内容复制到剪贴板。
如果想将pdf文件的所有页面合并导出，需要回到上一页，点击页面底部的“导出”。此时会弹出一个菜单。第一项是“合并全部图片生成pdf”，这个功能可将图片形式的pdf文件识别后导出为可阅读、可搜索的pdf文件。第二个选项是“保存所有图片到相册”，这个选项可将识别后的pdf文件每一页以图片的形式存储到相册。第三个选项是“复制识别结果”，可将所有pdf的内容复制到剪贴板。第四个选项是“复制并打开”，可将识别结果复制后打开分享菜单。第五个选项是“分享全部图片”，可将所有识别后的图片分享到其他应用。
如果想阅读所有的识别后的文字，可点击页面右下角的“查看识别结果”，此时会打开识别结果界面。该界面与图片的识别结果界面完全相同。可以左右滑动浏览到界面上的编辑框，旁白会朗读文件的所有内容。如果需要复制，可点击复制按钮。如果想导出，可以点击导出按钮，将识别结果导出为Word或txt文档。
以上就是本文介绍的全部内容。今天主要介绍了利用白描识别单张图片和批量识别图片的方法，以及pdf文件转换为Word文档或txt文档的方法。下篇，我们将继续介绍翻译图片、翻译文字、拍照识别、扫描文件、制作身份证扫描件、旋转图片以及利用Siri快速识别图片和翻译图片的方法，敬请期待。
更多实用的视障经验，更多新奇好物分享，欢迎大家关注微信公众号“西瓜无障碍”，我们每周一篇精华文章，咱们下周不见不散！
本帖来自爱盲客户端

		自动登录	找回密码
密码			立即注册