V2EX › locoz 的所有回复 › 第 58 页 / 共 314 页

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

1 ... 54 55 56 57 58 59 60 61 62 63 ... 314

❮

❯

2023-03-07 17:30:59 +08:00

回复了 BirlGoy 创建的主题 › OpenAI › 理解 chatpdf.com 的代码原理

@tool2d #27 回答的最大长度，跟输入的最大长度，应该是两个不同的概念？我这边之前测试 API 是存在 4096 token 的输入限制的。现在的关键问题其实是输入的最大长度。

2023-03-07 16:47:52 +08:00

回复了 BirlGoy 创建的主题 › OpenAI › 理解 chatpdf.com 的代码原理

@tool2d #24 我看文档是都有 token 数限制，不知道你说的无限 token 是怎么做到的？

2023-03-07 16:13:51 +08:00

回复了 BirlGoy 创建的主题 › OpenAI › 理解 chatpdf.com 的代码原理

@BirlGoy #20 是的，关键还是这个 token 数限制，而且长文很难饶过这个限制，无论是简化还是分段都容易出问题。只能看 openai 愿不愿意给定制用户提升限制了，能提升或许还能做相关的操作。

2023-03-07 16:10:30 +08:00

回复了 Auth0 创建的主题 › OpenAI › OpenAI 给我开了 300 刀

@zhouqian #78 因为 openai 本来就送 18 刀的免费额度，只要注册了账号就有，所以可以通过无限增加账号来堆免费额度...这个规则漏洞后面大概率要被封的，太多这么薅羊毛的了，肯定会影响正常用户使用和 openai 的营收。

2023-03-07 13:02:30 +08:00

回复了 BirlGoy 创建的主题 › OpenAI › 理解 chatpdf.com 的代码原理

@BirlGoy #16 不不不，不是喂给它的参考内容太少，而是「文本转向量并匹配」这部分操作的匹配并不一定准确、完整。我当然知道 ChatGPT 本身没有问题，这方面用途我已经用了挺久了，只不过之前都是部分段落内容输入，而不是完整内容输入。

“先让 gpt 回答一次，根据答案去搜索 embedding ，再把这些内容参考交给 gpt 回答一次”
这种方式就我目前给的文件来说，没啥用...因为第一步的匹配操作就已经没有匹配到正确位置了，ChatGPT 也没法做出正确的描述，更别提后续基于这问问题了。

2023-03-07 11:30:00 +08:00

回复了 BirlGoy 创建的主题 › OpenAI › 理解 chatpdf.com 的代码原理

试了一下，对于高度定制化的内容，这种处理方式还是不太行，因为不一定能匹配到对应的原文，自然也就会导致 AI 要么猜内容、要么说不知道。

如果是常规的知识类书籍，由于数据很可能已经被学习过了，这种方式就相当于做了一个预先输入、限定回答范围的过程，能使回答内容更精准些，但回答的内容其实不一定是来自于 PDF 内。

所以：
@proxytoworld #1
实际并没有办法真正意义上地绕过 token 限制。

@tool2d #2
@justin2018 #9
实际只是相关内容已经被学习过了。

2023-03-07 11:21:53 +08:00

回复了 kqq19930511 创建的主题 › macOS › mac 有 samba 的图形化客户端吗？

finder 的 samba 连接确实毛病一堆，连接麻烦还老卡顿，跟 windows 上那种挂载个虚拟盘的体验没法比...

2023-03-07 11:20:44 +08:00

回复了 sewer 创建的主题 › 程序员 › 写的套壳 GPT 上 Trending 了~~这都行.🤣

通知滤盒也是有在做 AI 识别，不过这种功能主要还是个隐私问题，毕竟有些通知内容会涉及到身份证、手机号、行程之类的信息。

2023-03-07 11:18:04 +08:00

回复了 brader 创建的主题 › 程序员 › ChatGPT 的/v1/chat/completions 接口流式响应设计有点不科学

当时抓包看到这返回方式的时候就感觉很蠢...明明可以分开两部分传输，却非要放在一个 json 里返回，导致流量浪费极大。只能说做术业有专攻，做 AI 的并不懂后端和网络。

2023-03-07 08:15:27 +08:00

回复了 Auth0 创建的主题 › OpenAI › OpenAI 给我开了 300 刀

这是完全可以预料到的…

2023-03-04 11:48:23 +08:00

回复了 otite 创建的主题 › 程序员 › ChatGPT 新发布的 API 好快，免费的套壳网站也出来了

@acctv2 #226 那说明你账号的 api key 被别人调用了啊...官方的 chat 页是独立的，根本不会在开放 api 那部分里产生记录。

2023-03-04 09:32:43 +08:00

回复了 otite 创建的主题 › 程序员 › ChatGPT 新发布的 API 好快，免费的套壳网站也出来了

@acctv2 #59 具体是什么场景下使用到了其他模型呢？

2023-03-04 09:30:40 +08:00

回复了 otite 创建的主题 › 程序员 › ChatGPT 新发布的 API 好快，免费的套壳网站也出来了

@shuxhan #47 不是故意的，其实是 openai 在网页版里做了预设的要求，但 API 得用户自己设置，所以输出结果会有差异。

2023-02-27 22:01:04 +08:00

回复了 qq1147 创建的主题 › OpenAI › 有类似 chatGPT 的开源 AI，能通过输入特定的知识集，如法律/医学相关书籍，将其训练成某个领域的专家吗？

@qq1147 #17 https://help.openai.com/en/articles/6787051-does-chatgpt-remember-what-happened-earlier-in-the-conversation

2023-02-27 20:23:30 +08:00

回复了 GeruzoniAnsasu 创建的主题 › 问与答 › 你们觉得写笔记，耗费或浪费时间吗？平均每篇时长需要多久？

另外，笔记的关键在于帮助自己整理思路，而不是对外输出。如果你写笔记是为了对外输出，那你当然会写得很累、很耗费精力。因为你需要做润色、做校对，需要考虑别人能不能看懂，没办法放开。说白了，笔记少、零碎才是正常的现象。

2023-02-27 20:20:43 +08:00

回复了 GeruzoniAnsasu 创建的主题 › 问与答 › 你们觉得写笔记，耗费或浪费时间吗？平均每篇时长需要多久？

对于我来说，笔记分两种。一种是速记，临时用短句描述一下事情、想法，避免忘记；一种是具体分析类的长笔记，本质上跟需要发布的文章差不多，但是完全不会考虑润色问题，前后逻辑可能会很跳脱，想到啥就单独列一条出来。

无论是哪一种，对于我来说其实都不需要额外耗费什么时间，基本就是想到啥顺手就打出来了。

而且你说的其实不应该称之为笔记了，而是被发布出来的文章，它跟笔记本来就属于两种不同的东西，没什么好对比的。

2023-02-27 20:12:23 +08:00

回复了 qq1147 创建的主题 › OpenAI › 有类似 chatGPT 的开源 AI，能通过输入特定的知识集，如法律/医学相关书籍，将其训练成某个领域的专家吗？

你说的其实就是：基于大模型做微调，产生一个垂直行业的定制模型。这是有的，也是可行的。
事实上你自己用 ChatGPT 就能做到一定程度的这种效果，只不过受限于它的记忆容量（ token 数），只能做一些比较简单的微调，而且需要每次提问都强调来避免跑偏。

2023-02-26 15:06:01 +08:00

回复了 skai0dev 创建的主题 › MacBook Pro › MBP 的屏幕该用什么擦拭啊

@sisyphus60 #77 你说的是那个蓝色的、很多凸点的布？那个是明显比超细纤维布要粗糙的，如果想尽量不留痕迹就尽量别用那个。

2023-02-24 21:04:54 +08:00

回复了 huiyanpohundh123 创建的主题 › 问与答 › 为什么软件公司这么喜欢用「微」字，微软，微博，微服务啥的

@gushu #15 超聚变表示很草

2023-02-20 09:38:48 +08:00

回复了 BirlGoy 创建的主题 › OpenAI › 国内信用卡订阅 ChatGPT Plus

@wqzjk393 #10 你写过爬虫应该很清楚，没有提供 API 不代表不能用。真要用来开发应用，抠 API 下来就行了。

1 ... 54 55 56 57 58 59 60 61 62 63 ... 314

❮

❯