全局通栏广告

爱盲论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 598|回复: 6
打印 上一主题 下一主题

听见世界这是个什么玩意儿?

[复制链接]

8

主题

1101

帖子

5302

积分

金牌会员

Rank: 5Rank: 5

积分
5302
楼主
发表于 2024-3-3 15:31:56 | 显示全部楼层
楼主 蒲公英的种子说:
本帖最后由 蒲公英的种子 于 2024-3-3 16:20 编辑

1楼,楼主,老凡说IT之家 3 月 2 日消息,据复旦大学官方公众号,在复旦大学自然语言处理实验室 (FudanNLP) 师生的努力下,基于多模态大模型“复旦?眸思”(MouSi) 为视障者量身打造的“听见世界”App 上线。
这套系统仅需一枚摄像头、一对耳机,就能将画面转化为语言,且支持描绘场景、提示风险等功能。“听见世界”App 可为视障者日常生活需求设计三种模式。
街道行走:该模式下,“眸思”能够细致扫描道路情况,提示潜在风险。
自由问答:可帮助视障者走进博物馆、艺术馆、公园,捕捉四周景象每个细节,可用声音构建丰富的生活场景,官方演示图显示,该 App 还可实现转述电视画面内容等功能。
寻物:该模式为视障者提供日常物件的寻觅功能,官方称其为“可靠管家”。
▲ 图源复旦大学,下同
据悉,预计今年 3 月,“听见世界”App 将完成第一轮测试,并在中国一、二线城市和地区同步开启试点,根据算力部署情况进行推广。
IT之家注:复旦大学自然语言处理实验室(FudanNLP)此前开发了 MO 大模型,2023 年 4 月宣布正式开源,成为国内首个插件增强的开源对话语言模型。半年时间后,多模态模型“眸思”问世。
来自之多云,20小时前发布
本楼来自 天坦百宝箱VIP会员
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋| 爱盲论坛  

GMT+8, 2024-5-10 19:42 , Processed in 0.280780 second(s), 24 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表