全局通栏广告

爱盲论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 16305|回复: 0
打印 上一主题 下一主题

无障碍优秀,如何使用手机版白描识别图片和pdf文件

[复制链接]

53

主题

266

帖子

773

积分

中级会员

Rank: 3Rank: 3

积分
773
跳转到指定楼层
楼主
发表于 2023-12-11 07:01:35 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
楼主 智慧西瓜说:
白描是一款非常优秀的文字识别工具,可以帮助我们将图片和pdf中的文字提取出来进行阅读和编辑。之前我们介绍过白描桌面版识别图片和pdf文件的操作方法。大家可以在公众号回看。相比桌面版软件,手机版白描的功能更加强大,除支持图片和pdf文件的识别外,还增加了图片翻译、扫描文件、拍照识别、制作身份证扫描件以及利用siri快速识别等功能。下面为大家逐一进行介绍。需要注意的是,本文基于白描iOS版撰写,安卓版的操作与之类似,大家可以对照本文探索一下操作方法。
1.        识别图片。这是白描的主打功能,也是笔者经常使用的功能。在日常生活和工作中,经常会遇到很多图片文件,比如群内的通知、购物软件中的商品介绍等。此时就可以借助白描进行识别。很多人可能有疑问,现在iOS系统的旁白以及我们常用的微信等工具都有文字识别功能,为何还要用白描进行识别。这里就体现了白描的专业性。白描具有识别速度快、准确率高、排版与原文高度统一等特点。对于视障人士来说,识别图片最关键的是识别的准确率,这方面经过笔者对比测试,白描识别后的准确率仍有一定优势。并且其识别后的文字与图片上原有的格式基本一致,方便用户后续的编辑和排版。
操作时,我们首先将需要识别的图片保存到相册,然后打开白描,手指触摸屏幕左下角,可以找到一个“图片”的提示,双击选中。此时屏幕上按照时间倒序列出了相册中的所有图片,即刚刚保存的照片位于屏幕最上方。用手指触摸屏幕左上方,可以找到“照片1”的提示,同时旁白会读出图片的拍摄日期。如果使用最新版系统,旁白还会读出图片中文字的大致内容,可以帮助我们确认是否是要识别的图片。确认无误后,双击该图片可进入识别选项界面。
在打开的界面上用左右滑动手势浏览,首先可以找到一个“文字”的按钮,点击后可以选择识别的内容类型。包括文字、竖排文字、表格和自由选区。自由选区是通过手指框选需要识别的区域,这个功能视障用户操作起来有一定困难。常用的是“文字”和“表格”两个选项。如果不知道要识别的图片中是什么内容,直接选文字即可。如果明确知道图片中是表格,就选择“表格”选项。继续向右滑动,可以找到“中英文”的按钮。点击后可以选择识别内容的语言。正确选择语言可以提高识别的准确率。日常生活中,多数用户最常使用的是中文和英文,选择默认即可。点击该按钮可以看到法语、德语、韩语等选项,大家根据图片内容的语言进行选择。如果经常有多语言识别的需求,也可以选择“自动检测”,白描会自动为我们选择识别语言。继续向右滑动可以切换到“导出”按钮。点击后可以浏览到三个选项,分别是“导出为pdf文件”、“保存到相册”和“分享图片”。继续向右滑动可以切换到“色彩”的选项,点击后可以对页面图文色彩进行设置,包括彩色文档瑞丽、彩色文档柔和、黑白文档等选项。继续向右滑动可以切换到“文字识别”的选项,双击后进入识别结果界面。
该界面上有一个编辑框,其中的文字就是识别后的结果。从编辑框继续向右滑动,可以切换到复制按钮,点击后可将编辑框中的文字复制到剪贴板。继续向右滑动可以浏览到复制并打开的按钮,点击后会先将识别后的文字复制到剪贴板,然后弹出要打开的菜单,里面可以添加常用的app,比如微信、QQ等。点击对应的app可以前往该应用。继续向右滑动可以切换到“导出“的按钮,点击后可以选择导出为docx或txt文件。点击相应格式后会弹出一个界面,可以浏览到一个以年月日开头的项目,这是分享后的文件名,点击后可以修改。继续点击分享按钮可以将识别后的文字以文档的形式分享到其他app。
如果一次需要识别多张图片,可以使用白描的批量识别功能。在图片选择界面长按某张图片,可启用图片多选功能。左右滑动找到需要识别的图片双击选中,一次可以选取多张图片,选择完毕后可在页面右下角找到一个以图片数量命名的按钮。比如选择了三张图片,按钮的名称为“三”,点击该按钮后即进入了识别选项界面,操作方法同上。
2.        Pdf文件转换。手机中的pdf文件最主要有两个来源。一个是存储在手机文件中的pdf文件,另一个是从其他应用中获取的文件。这两个来源的文件识别流程略有区别。如果要识别手机中的pdf文件,可以打开白描,点击页面左下角的“图片”,随后点击页面右上角的“更多功能”,在弹出的菜单中选择“pdf文件识别转换”。此时会打开苹果手机的文件应用,在其中可以选择需要识别的文件,双击即可导入白描;如果是从其他应用中获取的pdf文件,可以打开文件后,从菜单中选择用其他应用打开,再选择白描进行识别。
以最常用的微信为例。在聊天对话框找到一个pdf文件,打开后在页面的右上角找到“更多”按钮,点击后在弹出的菜单中点击“用其他应用打开”,在弹出的应用列表中选择白描,继续在弹出的页面上点击“进入白描转换pdf文件”。应用会提示处理中,稍等片刻后会弹出一个界面,程序会将pdf的每一页拆分成一张照片显示在该界面上。如果只是想转换pdf,可以点击屏幕右下角的文字识别,点击后程序会逐页进行识别,识别完成后右下角的标签名称会变为“查看识别结果”。
利用滑动手势可以浏览屏幕上的每张图片,点击图片可以进入查看每页的识别结果。这里的识别结果是按照图片原有的格式进行排版,使用左右滑动的手势可以在上一行和下一行文字之间切换。如果想导出该页面的识别结果,可以点击“导出”,这里提供了很多导出选项。比较常用的是“导出当前页面为pdf文件”或“保存当前图片到相册”,可根据实际需要进行选择。如果想复制该页面的识别结果,可以点击“去文字查看界面”,进入后点击复制按钮,可将该页面的内容复制到剪贴板。
如果想将pdf文件的所有页面合并导出,需要回到上一页,点击页面底部的“导出”。此时会弹出一个菜单。第一项是“合并全部图片生成pdf”,这个功能可将图片形式的pdf文件识别后导出为可阅读、可搜索的pdf文件。第二个选项是“保存所有图片到相册”,这个选项可将识别后的pdf文件每一页以图片的形式存储到相册。第三个选项是“复制识别结果”,可将所有pdf的内容复制到剪贴板。第四个选项是“复制并打开”,可将识别结果复制后打开分享菜单。第五个选项是“分享全部图片”,可将所有识别后的图片分享到其他应用。
如果想阅读所有的识别后的文字,可点击页面右下角的“查看识别结果”,此时会打开识别结果界面。该界面与图片的识别结果界面完全相同。可以左右滑动浏览到界面上的编辑框,旁白会朗读文件的所有内容。如果需要复制,可点击复制按钮。如果想导出,可以点击导出按钮,将识别结果导出为Word或txt文档。
以上就是本文介绍的全部内容。今天主要介绍了利用白描识别单张图片和批量识别图片的方法,以及pdf文件转换为Word文档或txt文档的方法。下篇,我们将继续介绍翻译图片、翻译文字、拍照识别、扫描文件、制作身份证扫描件、旋转图片以及利用Siri快速识别图片和翻译图片的方法,敬请期待。
更多实用的视障经验,更多新奇好物分享,欢迎大家关注微信公众号“西瓜无障碍”,我们每周一篇精华文章,咱们下周不见不散!
本帖来自爱盲客户端
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋| 爱盲论坛  

GMT+8, 2024-12-25 14:18 , Processed in 0.452119 second(s), 27 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表