爱盲论坛

标题: 聊一聊OCR你最想拥有的功能。 [打印本页]

作者: 杨柳    时间: 2021-5-21 07:48
标题: 聊一聊OCR你最想拥有的功能。
我想要的是高质量的看图说话。比如说这张图片是一个人,那我想知道他长得怎么样?她的外貌穿着。另外就是能够识别大量数据,比如卫星云图雷达图里面的各种信息资料。欢迎讨论,禁止人身攻击。
本帖来自安卓秘书
作者: 时光    时间: 2021-5-21 07:54
ocr 最想要的功能,一个是高级图片描述就像楼主所说的那样这样会为我们打通很多盲区,一个是高速零延迟的具体图像反馈,到了有一天整个图片阅读可以向我们在浏览普通图标那样丝毫无感的时候就是神功大成的时候,哈哈,这个要等很久了,理论上说应该有可能的。
本帖来自微秘
作者: 糖糖    时间: 2021-5-21 08:29
现在是男是女,能不能识别出来啊?还有一个就是说。这张图片上是什么内容?有山有水,有数啊。不知道能不能描述。大概描述一下也可以呀。
本帖来自安卓秘书
作者: 风中漫步    时间: 2021-5-21 08:52
OCR如果要能实时朗读视频就得了,当然我说的不是字幕,而是你在看视频的时候,就像无障碍电影那样给你朗读这个估计10年内实现不了


作者: 杨柳    时间: 2021-5-21 09:13
标题: 回地板风中漫步
是的。应该不用等那么久。
本帖来自安卓秘书
作者: 杨柳    时间: 2021-5-21 09:13
标题: 回板凳糖糖
简单的可以,但是详细的不行。
本帖来自安卓秘书
作者: amhl    时间: 2021-5-21 09:42
标题: 回沙发时光
记得原来起名同可以识别性别和年龄,微软小冰已经可以看图写诗了,只不过还没给咱们用而已
本帖来自安卓秘书
作者: amhl    时间: 2021-5-21 09:44
阿里还是百度忘了,不是可以智能识别小电影违不违法吗,只不过没有全都给咱们开放,有一个很重要的问题人家给咱们用,你们觉得大家会出多少钱呢,
本帖来自安卓秘书
作者: 糖糖    时间: 2021-5-21 09:47
电视剧里面的字幕现在都不完善,还朗读屏幕里边的视频内容的描述,那更加不行了。
本帖来自安卓秘书
作者: 傲世乾坤。    时间: 2021-5-21 12:59
[audiothread=33]http://audio.sky808.com/bbs/www.amhl.vip/20210521/60a73e4bafc7f.mp3[/audiothread]
本帖来自微秘
作者: 杨柳    时间: 2021-5-21 15:11
标题: 回10楼傲世乾坤。
那就是涉及到人的感情因素,这个比较复杂。比如一个人在阳台上欣赏风景。这个就很难界定。
本帖来自安卓秘书
作者: 杨柳    时间: 2021-5-21 15:12
因为人的变化是非常多的。比如说这一刻你站在这里,看起来你是在欣赏风景,其实你在思考问题。所以这个就很难判断。
本帖来自安卓秘书
作者: zmy    时间: 2021-5-21 17:08
功能我最想要的是文字识别的百分之九十九点九的准确或者是百分之一百的准确或者是图片翻页识别。
本帖来自安卓秘书
作者: 太阳雨    时间: 2021-5-21 20:19
这个至少在六g的时候,如果实现这一条,基本大多数的职业,都不需要人去做了,只需用机器就可以了
本帖来自安卓秘书
作者: 邻家大叔    时间: 2021-5-21 23:47
楼主也只能是想想了。再怎么样的描述都无法让你知道一个图片里的人到底长啥样?啥样的穿着。就算是有人给你描述,可能你脑子里的想象和现实当中完全是两个物种。而且还得是后天失明,脑子里才有视觉的概念。
本帖来自安卓秘书
作者: 邻家大叔    时间: 2021-5-21 23:50
当然只是简单的描述一下是男是女,穿着花裤衩还是花衣服,这应该还是可以做到的。
本帖来自安卓秘书




欢迎光临 爱盲论坛 (http://amhl.vip/) Powered by Discuz! X3.2