全局通栏广告

爱盲论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 15998|回复: 14
打印 上一主题 下一主题

安卓上也能体验chatGPT的图像描述啦,非常牛掰!落寞工具箱后台更新!

[复制链接]

40

主题

81

帖子

1905

积分

超级版主

Rank: 8Rank: 8

积分
1905
跳转到指定楼层
楼主
发表于 2023-11-8 10:27:51 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
楼主 落寞说:
chatGPT官方刚发布了图片上传接口,我们落寞工具箱也立马跟上,后台直接更新了AI智能图像描述!让小伙伴们都能第一时间体验到AI描述图片的强大!
在二楼我会放上一些chatGPT识别图片的结果,大家可以看看描述的如何,是否牛掰!
QQ交流群:554346279

安卓版软件可在群共享里下载,苹果版直接在apple store里搜索“落寞工具箱”即可。
打开软件后,在主界面上,点击相册旁边的识别类型,默认是离线识别。
点击后会弹出一个列表,在其中就能看到AI智能图像描述了。
选择AI智能图像描述后,我们在进行拍照识别,或者从相册选择图片,都会吧图片发给gpt,让它来描述!描述的非常详细,非常牛掰!
因为时间原因,暂时还不能对图片进一步的提问,电脑版也还没支持,等下版本都会增加!还请耐心等待!
注意,AI智能图像描述虽然非常非常的牛掰,但积分消耗也比较恐怖,它是利用gpt4来识别的,平均一张图片,要消耗二三十个积分不等,根据回答的字数来定,所以还请悠着点使用!
官方还有一些注意事项,也请仔细阅读:
虽然具有视觉功能的 GPT-4 功能强大,可用于多种情况,但了解该模型的局限性很重要。以下是我们注意到的一些限制:
医学图像:该模型不适合解释 CT 扫描等专业医学图像,不应用于医疗建议。
非英语:在处理包含非拉丁字母文本(如日语或韩语)的图像时,模型可能无法发挥最佳性能。
住:经过测试,现在识别中文效果不是很好,但英文、数字都是可以的,那如果只是要识别文字,还是用在线文字识别更加准确。
旋转:模型可能会误解旋转/颠倒的文本或图像。
视觉元素:模型可能难以理解颜色或样式(如实线、虚线或虚线)变化的图形或文本。
空间推理:该模型难以完成需要精确空间定位的任务,例如识别国际象棋位置。
准确性:在某些情况下,模型可能会生成不正确的描述或标题。
图像形状:该模型在处理全景和鱼眼图像时遇到困难。
元数据和调整大小:模型不处理原始文件名或元数据,并且在分析之前调整图像大小,从而影响其原始尺寸。
计数:可以给出图像中对象的近似计数。
验证码:出于安全原因,我们实施了一个系统来阻止提交验证码。
以下是软件详细介绍:
落寞工具箱-专为盲人打造的工具类软件,拥有聊天AIChatGPT、股票信息查询、拍照自动识别、自动朗读视频中文字幕、图形验证码识别、微软语音合成、语音转文本、音频转视频、pdf阅读、云剪贴板、图片合并缩放等众多功能!
有什么亮点?
1.内置全球最火爆的聊天AIChatGPT,发送消息,让它为你找软件、找错别字、取名字,甚至让它写小说,写代码!完全不同的聊天对话体验,让你体会到AI的强大!苹果手机还可直接将ChatGPT集成到Siri中,直接说话就能与ChatGPT互动!让语音助手瞬间人工智能!
2.股票信息查询,支持查询各大股市的历史行情,包括每天开盘价、收盘价、涨跌额、交易量等,最早能查询到股票刚上市!并且还有数据分析功能,让你了解股票价格走势!
3.安卓、苹果、windows,三大平台都集成离线文字识别,无需联网,快速响应!
4.屏幕自动识别(安卓、windows支持),开启后只要屏幕上显示的文字,瞬间识别朗读,典型场景,用来识别视频中文字幕,再也不怕看国外电影!除此之外浏览大量图片、某些直播软件公平不支持朗读等均可使用!可加群在群共享里收听如何朗读中文字幕的演示录音!
5.摄像头自动识别:不想一次次的点击拍照?打开自动识别,只需将摄像头对准要识别的文字,使用内置的离线文字识别,走到哪识别到哪!
6.识别位置提示:总是对不准文字,不知道文字在哪里?位置提示来帮你!每次识别玩后都会播报文字大概位置,例如左边、偏左等,根据提示将摄像头网相对应位置移动,配合自动识别,再也不怕对不准!如果使用在线文字识别,还可提示文字倾斜角度,例如向左倾斜180度,及代表文字颠倒,书本拿反,轻松得知物体的上下正反!
7.图像描述,拿到一个东西不知道是什么颜色?朋友圈里看到一张图片不知道拍的是什么?这时候就可以切换至图像描述,用一句话描述图片中的主要物体,并且基本都包含颜色信息,例如拍摄一只躺在地上的狗,可能就会告诉你,一只白色短毛狗躺在棕色地板上,让你对物体、颜色都有个大概了解!
8.图形验证码识别,无论安卓还是苹果,只要遇到图形验证码的界面,可直接截图,然后打开软件,使用验证码识别,只需选择验证码的大概区域,如上二分之一,及可轻松识别,准确率高达9成以上!从此苹果手机也可轻松识别图形验证码!
9.识别亮度,不知道家里是否开灯?使用亮度识别,将摄像头对准光源,即可得知亮与暗!
10.除此之外还有银行卡识别、身份证识别、植物识别、动物识别、钱币识别等接口共选择!特定场景准确度更高。
11.云笔记:可将重要文本内容保存至云端,安卓、苹果、windows三端同步查看,并且支持导入争渡云收藏,从此不怕重要信息丢失!
12.云剪贴板:云剪贴板可将当前设备的剪贴板数据同步至云端,不同于云笔记,云剪贴板的每次提交,都将覆盖之前的内容,方便在不同平台上频繁共享文本的场景。并且为了方便提交获取,无论任何平台,都有快捷方式可以一键提交,一键获取,可在个人中心点击帮助,收听多平台同步剪贴板数据的演示录音,从此多平台剪贴板同步轻松快捷!除此之外电脑版还拥有多剪贴板功能,可自动记录每次复制的文字,支持使用热键直接查看浏览,就仿佛多了无数块剪贴板,让你随心切换!
13.pdf阅读:无论是文字版还是扫描版pdf,直接选择使用落寞工具箱打开,文字版直接朗读,扫描版自动识别后朗读,给你带来阅读普通电子书的体验!并且支持直接导出成txt。
14.文本转语音:嫌听书机上的语音不好听?现在开始使用微软超逼真的TTS,将文本转换成语音,包括晓晓、云西等数十个发音人,温柔、深情、冷静等十几种风格,中文、英语、日语等多种语言,总有一款适合你!
15.语音转文本:有课堂、会议录音想转成文字,整理成笔记?看到了一步国外影片但苦于没有中文字幕?使用语音转文本,轻松将音视频中的语音转成可编辑的文本,操作专为视障用户设计,编辑查看简洁明了,还支持导出成txt、外挂字幕等。
16.音频转视频:可使用一张图片将音频转为视频,并且可直接发送到各类短视频平台。注:如果不提供图片,那转换出的将是纯黑视频。
17.图片合并,可将多张图片竖排或横排合并成一张图片,支持放大缩小、旋转等。
18.siri集成支持(仅限苹果),保存了一张图片后,可直接对siri说“识别最新照片”,及会掉起软件自动识别,方便快捷!
19.在QQ、微信等软件里收到的pdf、txt、音频都可选择直接用软件打开,pdf直接阅读、文本直接转语音、音频直接转文本,其次系统相册里的图片也支持用软件打开进行识别。
除此之外还有文本拆分、二维码生成与解析等小功能不断添加中!

分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏
回复

使用道具 举报

396

主题

4361

帖子

1万

积分

金牌会员

Rank: 5Rank: 5

积分
10675
15#
发表于 2023-11-10 09:14:40 | 只看该作者
<
15楼 月亮雨说:回复13楼牛魔王
当然可以呀
本帖来自微秘
回复 支持 反对

使用道具 举报

6

主题

335

帖子

948

积分

中级会员

Rank: 3Rank: 3

积分
948
14#
发表于 2023-11-9 21:16:42 | 只看该作者
14楼 牛魔王说:
回复 13楼 牛魔王
或者我要把6张图片,按照比例弄成一个两分钟的视频
本楼来自 天坦百宝箱
回复 支持 反对

使用道具 举报

6

主题

335

帖子

948

积分

中级会员

Rank: 3Rank: 3

积分
948
13#
发表于 2023-11-9 21:15:34 | 只看该作者
13楼 牛魔王说:
回复 1楼 落寞
把图片弄成视频的话,能不能弄成我想要的长度。比如我想把一张图片弄成一个20秒长度或者15秒长度的视频
本楼来自 天坦百宝箱
回复 支持 反对

使用道具 举报

3

主题

147

帖子

535

积分

中级会员

Rank: 3Rank: 3

积分
535
12#
发表于 2023-11-9 19:52:26 | 只看该作者
<
12楼 童年.说:回复楼主落寞
支持
本帖来自微秘
回复 支持 反对

使用道具 举报

16

主题

162

帖子

1936

积分

高级会员

Rank: 4

积分
1936
11#
发表于 2023-11-9 00:34:30 | 只看该作者
11楼 不灭的笑容说:
3.82 复制打开抖音,看看【不灭的笑容的作品】落寞工具箱,正式接入Chat Gpt4图像描述!#... https://v.douyin.com/iR24LAdw/ M@w.sR 05/04 fOx:/
本帖来自微秘安卓版
回复 支持 反对

使用道具 举报

29

主题

761

帖子

5217

积分

金牌会员

Rank: 5Rank: 5

积分
5217
10#
发表于 2023-11-8 20:42:19 | 只看该作者
10楼 降龙十八掌说:
不错
本帖来自微秘安卓版
回复 支持 反对

使用道具 举报

396

主题

4361

帖子

1万

积分

金牌会员

Rank: 5Rank: 5

积分
10675
9#
发表于 2023-11-8 20:04:06 | 只看该作者
<
9楼 月亮雨说:回复7楼晴空
现在这个人工智能,让他画什么图画,他就能画什么图画,只要跟他说就行了,,如果画出来的图感觉步满意,还能随意修改
本帖来自微秘
回复 支持 反对

使用道具 举报

396

主题

4361

帖子

1万

积分

金牌会员

Rank: 5Rank: 5

积分
10675
8#
发表于 2023-11-8 20:02:38 | 只看该作者
<
8楼 月亮雨说:回复7楼晴空
确实神奇
本帖来自微秘
回复 支持 反对

使用道具 举报

71

主题

556

帖子

3902

积分

高级会员

Rank: 4

积分
3902
7#
发表于 2023-11-8 19:41:02 | 只看该作者
7楼 晴空说:
太神奇了
本楼来自 天坦百宝箱
回复 支持 反对

使用道具 举报

21

主题

197

帖子

3210

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
3210
6#
发表于 2023-11-8 18:00:31 | 只看该作者
<
6楼 风声说:回复沙发落寞
很强大。
本帖来自微秘
回复 支持 反对

使用道具 举报

9

主题

890

帖子

3349

积分

高级会员

Rank: 4

积分
3349
5#
发表于 2023-11-8 17:42:22 | 只看该作者
<
5楼 我是宁夏人说:回楼主落寞
非常好,好的很。
本帖来自爱盲客户端
回复 支持 反对

使用道具 举报

91

主题

942

帖子

4472

积分

高级会员

Rank: 4

积分
4472
地板
发表于 2023-11-8 16:16:16 | 只看该作者
地板 糖糖说:
描述的挺详细。
本帖来自微秘安卓版
回复 支持 反对

使用道具 举报

396

主题

4361

帖子

1万

积分

金牌会员

Rank: 5Rank: 5

积分
10675
板凳
发表于 2023-11-8 14:29:00 | 只看该作者
<
板凳 月亮雨说:回复沙发落寞
好,比较好
本帖来自微秘
回复 支持 反对

使用道具 举报

40

主题

81

帖子

1905

积分

超级版主

Rank: 8Rank: 8

积分
1905
沙发
 楼主| 发表于 2023-11-8 10:28:06 | 只看该作者
沙发 落寞说:
下面这都是chatGPT识别出的结果:
第一张图片:
此图片展示了两个站在喷泉前的儿童。图片由晚上拍摄,背景中含有喷泉和夜晚城市的光线。
左边的儿童是一名女孩,她穿着粉红色的连衣裙,带有白色的装饰和蝴蝶结。她的发带是黑色带有粉红色边缘。女孩的表情严肃,直接望向摄像头。
右边的儿童是一名男孩,他穿着一件带有徽章的运动风格的白色T恤,以及一条白色的短裤。他的表情也很严肃,目光也直视着摄像头。
喷泉的水花在灯光的照射下显得很亮,周围环境较暗,但可以看到远处有通亮的市区灯光。喷泉的水因曝光时间较长,看起来是模糊的白色水幕,背后是模糊的城市夜景。整体照片氛围感觉祥和且安静。
第二章图片:
这张图片显示的是一座破败的建筑。它位于一个丛生杂草的开阔地带,四周环绕着树木和植被。建筑本身的墙壁多为灰白色,部分墙面已经倒塌,露出了背后的红砖结构。屋顶的瓦片几乎全部不见,只剩下零散的几块瓦片悬挂在锈迹斑驳的钢筋上。 建筑的前方有一片绿色的草地,其中杂草未修剪,生长得相当自由。画面的左侧可以看到一棵赤褐色的枯树,其树枝伸向天空。在右侧背景中,可以窥见更多的树木和植被,颜色从浅绿到深绿不等。天空呈现出一种晴朗的蓝色,没有云彩,这暗示着拍摄时天气很好。 此场景给人一种被遗弃和时间侵蚀的感觉,这座建筑看起来已长时间无人照管,自然力量正慢慢地将它回归自然。尽管破旧,场景中依然散发出一种特殊的静谧和过去岁月的回声
第三章图片:
这是一张描绘着一个有着狼耳朵的动漫风格人物的插图。整体色调明亮,背景以蓝白相间的天空为主,给人一种开阔上望的感觉。人物正从下往上看,她的头发和耳朵呈现出银灰色,与头发颜色相匹配的是她厚实的白色毛领,这些元素结合在一起营造出一种神秘和野性的气息。 人物的眼睛颜色富有表现力,看起来有着一种深邃和复杂的感觉,眼神中透露出一丝认真和好奇。她的脸上有着轻微的妆容,增加了视觉的细节。此外,她佩戴着一条宝石缀饰的链子,似乎具有某种装饰或仪式意义。 人物身穿简约的服装,以暗棕色和灰色为主,透露出实用和战斗准备的风格,肩膀上披有一件棕色斗篷。她左手持有一个能够反射光芒的黑色物体,看上去像是一只大角瓶或望远镜,这增加了探险和神秘的感觉。 整体来看,图片中的人物似乎是一名探险者或战士,既有女性的柔美也有野性的力量表现。细节描绘得非常精细,色彩的搭配也很和谐。
第四章图片:
这幅图像是一张描绘了一个动画风格的女性角色的插画。角色有着金黄色的头发,耳朵形状和位置类似于狐狸,暗示可能是某种狐狸精神或动物化身。 她穿戴的是一套结合了传统和幻想元素的服装。服装主色调是白色、黑色和深红色。她的衬衫是主要是白色的,有着泡泡袖,而裙子是黑色的带红色图案。她佩戴有一条红色的腰带和一些淡金色的装饰。 角色头戴一朵黄色和白色的花朵,以及更小的蓝色和橙色花朵构成的装饰。她的头发被一条橙色的头带束起。 在角色的背后是打开的红色扇子,占据了整个画面的上方,其上有一些抽象的图案和渐变色。背景以淡蓝色和淡紫色为主,并有散落的花瓣和星星点缀,同时有一些雪白色的云朵。 整体色彩鲜艳,给人一种温暖且梦幻的感觉。画风充分表现了东方文化影响下的虚构角色设定。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋| 爱盲论坛  

GMT+8, 2024-12-26 13:58 , Processed in 0.303495 second(s), 26 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表