爱盲论坛

标题: 听见世界这是个什么玩意儿? [打印本页]

作者: 简单的快乐0917    时间: 2024-3-3 11:54
标题: 听见世界这是个什么玩意儿?
软件打开之后,一直提示在识别,就是识别不出来什么
本帖来自微秘iOS端
作者: 小飞客    时间: 2024-3-3 14:24
这是个啥软件啊?没听说过。
本帖来自微秘安卓版
作者: 蒲公英的种子    时间: 2024-3-3 15:31
本帖最后由 蒲公英的种子 于 2024-3-3 16:20 编辑

1楼,楼主,老凡说IT之家 3 月 2 日消息,据复旦大学官方公众号,在复旦大学自然语言处理实验室 (FudanNLP) 师生的努力下,基于多模态大模型“复旦?眸思”(MouSi) 为视障者量身打造的“听见世界”App 上线。
这套系统仅需一枚摄像头、一对耳机,就能将画面转化为语言,且支持描绘场景、提示风险等功能。“听见世界”App 可为视障者日常生活需求设计三种模式。
街道行走:该模式下,“眸思”能够细致扫描道路情况,提示潜在风险。
自由问答:可帮助视障者走进博物馆、艺术馆、公园,捕捉四周景象每个细节,可用声音构建丰富的生活场景,官方演示图显示,该 App 还可实现转述电视画面内容等功能。
寻物:该模式为视障者提供日常物件的寻觅功能,官方称其为“可靠管家”。
▲ 图源复旦大学,下同
据悉,预计今年 3 月,“听见世界”App 将完成第一轮测试,并在中国一、二线城市和地区同步开启试点,根据算力部署情况进行推广。
IT之家注:复旦大学自然语言处理实验室(FudanNLP)此前开发了 MO 大模型,2023 年 4 月宣布正式开源,成为国内首个插件增强的开源对话语言模型。半年时间后,多模态模型“眸思”问世。
来自之多云,20小时前发布
本楼来自 天坦百宝箱VIP会员
作者: 银河比邻星    时间: 2024-3-3 17:45
标题: 回复楼主简单的快乐0917
现在应该还没开放,得再等等。详情看这段:
据悉,预计今年3月,“听见世界”App将完成第一轮测试,并在中国一、二线城市和地区同步开启试点,根据算力部署情况进行推广。
本帖来自微秘
作者: 龙傲天    时间: 2024-3-3 21:35
我龙傲天来了
本楼来自 天坦百宝箱
作者: zmy    时间: 2024-3-3 21:53
有没有软件的下载地址


,来自、时时助手v4

作者: 洗剪吹    时间: 2024-3-3 22:21
我还是期待老马的脑机接口吧,这玩意不靠谱,太危险。
本楼来自 天坦百宝箱




欢迎光临 爱盲论坛 (http://amhl.vip/) Powered by Discuz! X3.2