试了下 ChatGPT 的图像理解,比预期好,效果还是很赞的。
现在能想到的一些用途包括:
其他还要啥好的使用场景吗?
|  |      1whatv3      2023-10-09 09:54:19 +08:00 验证码... | 
|  |      2jimrok      2023-10-09 10:02:27 +08:00 去除水印 | 
|      6zealotxxxx      2023-10-09 13:11:42 +08:00  3 你直接看微软发的那个论文,基本说的很全了。 [2309.17421.pdf]( https://browse.arxiv.org/pdf/2309.17421.pdf) | 
|      7maxxfire      2023-10-09 13:38:03 +08:00 大家来找茬游戏,可以玩通关了 | 
|  |      8JayZXu      2023-10-09 14:15:00 +08:00 如果速度能提升的话,对视障人士还是挺有用的 | 
|  |      9jimrok      2023-10-09 14:16:48 +08:00 修改设计图可能行,把老王 p 掉,把老王 p 好看点 | 
|  |      10xuelang OP @zealotxxxx 感谢,我瞅下 | 
|  |      11tuutoo      2023-10-09 15:22:09 +08:00 有人能使用这个图像识别功能了没?上次看了介绍,但啥时候有这功能啊。 | 
|  |      12iorilu      2023-10-09 15:36:23 +08:00 这么说打码问题可以解决了? | 
|      18qiany      2023-10-09 22:54:20 +08:00 检测员工摸鱼时长 | 
|  |      19youthfire      2023-10-10 10:06:56 +08:00 其实应用场景可以有很多,但是限制权在别人手里。比如说,interpretor (Advanced Data Analyze),出来的时候可以进行复杂的表格结构分析,然后完成 ocr ,最后排版。当时我经常用在业务上。但是现在只剩“告诉你逻辑/思路”,连 ocr 都不能顺利完成,不是告诉你环境缺失相关组件,就是一顿分析后质量很低,又或者提供惨不忍睹的部分结果。所以这个问题,回到图像理解能力上也是一样,它能懂,但是对于能不能做到你的需求,一直是变量。能力是有,但是服务商略微调整,你这边的结果,或者应用能力就变动很明显。 | 
|  |      20MelodyZhao      2023-10-10 10:47:44 +08:00 看图讲故事,还是挺不错的 | 
|  |      22xuelang OP  1 |