大家好!
很高兴向大家介绍我们最新的 AI Native 应用——ScreenAI !一款基于多模态大模型的 macOS 应用。
ScreenAI 是一款强大的 macOS 应用,只需截屏,其余的工作由先进的多模态 AI 完成。 无论是日程安排、解释内容、聊天回复等,ScreenAI 都能无缝整合到 Apple 原生应用中,提升工作效率。
因为想提供最原生的体验,使用的是 SwiftUI 开发的,因此目前只支持 MacOS 。其他平台的可能需要再等等。
软件可以免费下载,但是因为多模态大模型并不便宜,所以还是需要付费的。
不过每个电脑可以免费使用 100 个 credit
额外的需要在官网付费购买,效果好就买,按需付费
自己经常逛 V2EX ,非常感谢网站!
下面回复中,我按照回复楼数属于奇数,并且留下邮箱的前 10 名,每人额外赠送 100 个 credit
1
Jinn666 139 天前
支持
|
3
chongchongzl999 139 天前
可以试一试,[email protected]
|
4
pol 139 天前
我没有 mac ,我来帮大家抗住这个偶数位,有请下一位幸运儿
|
5
hoythan 139 天前 1
视频太过于啰嗦,竟然有 50% 都在读网页上的文字,演示上看功能没有什么特点,解决不了任何痛点。代办只能一条一条截吗?
可能还需要继续摸索下。 |
6
m502002313 139 天前
|
7
yanghanlin 139 天前
支持,另外请问有计划实现接入用户自定义的模型 API 接口吗(目前国内一些大模型提供商价格非常低甚至免费,且能够提供与 OpenAI 兼容的 API ,希望能够利用这些大模型完成工作)
|
8
DjvuLee OP @hoythan 视频录的确实不够好,这个接受。待办目前只能是,你如果愿意,可以体验一些就知道有多方便。比如领导给你再群里面说了一句话,同时给你分享了一个腾讯会议的链接。你完全不用切换工作环境。不要打开腾讯会议,就把事情记录下来了。
|
9
makebuke 139 天前
|
10
DjvuLee OP @yanghanlin 这个有计划,但是优先级不高。其实我们尝试了很多国内的模型,在稳定性,靠谱程度上确实不够好。我们最终关注的是体验,能够给用户提供沉浸式的体验。
|
11
DjvuLee OP @chongchongzl999 已经发送,请稍后查收邮件。
|
12
matrix1010 139 天前
我觉得价格上有待商榷, $5/100 credits 有点贵了。如果只是 ocr 一下发给 LLM ,就算 System Prompt 再复杂也就消耗个几百 Token? 那成本可能连几分钱都没有
|
14
DjvuLee OP @matrix1010 谢谢指正,我们希望通过其他方式来优惠有需要的同学。如果只是 OCR ,其实可以免费给大家用,背后是真正的多模态大模型,因此我们才可以说是 AI Native 的尝试。
|
15
DjvuLee OP @matrix1010 您如果有兴趣,可以让它截图识别一个完全没有文字的桌面背景看看。如果是 OCR ,那么大模型什么也接收不到,也给不出回答。但是 screenAI 是可以给出来的。
|
16
matrix1010 139 天前
@DjvuLee Gemini 1.5 Flash 的图片输入价格是 $0.0001315 / 图片, 说实话还是略贵...
|
17
dixin 139 天前
|
18
m502002313 139 天前
我还没用,怎么上来就没 credits 了...
|
19
DjvuLee OP @matrix1010 接受您的指正,我们后续再看看如何优化。目前我们主要是以统一的方式来让用户进行计费,就是不管什么任务。这个也包括了如果上游大模型厂商有问题,我们重试的消耗这部分。用户只需要关注体验就行。
|
20
DjvuLee OP @m502002313 这个是您的网络可能无法连接到 cloudflare 上。因为我们第一次的时候需要从服务器端获取 credits 。
|
22
maemolee 138 天前
|
24
DjvuLee OP @yanghanlin 今天我们已经支持了国内的 Qwen
|
25
delai 138 天前
就首页而言,视频介绍确实太啰嗦了,建议 30s 内,https://html.tofigma.com/ 我们刚上了个视频,可以参考
|
28
ibiza 137 天前
这个交互方式挺有启发
|