最近取消订阅了多家厂商的包月 token 服务,现在纯按 token 量消费, 因为它们都有降智问题。 - V2EX

首页注册登录

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

主要的问题是这些厂商，它的后台的模型并不总是用了它的主力的模型，会在后台降智。
智谱的这个 GLM 4.6 ，新出的 Minimax M2 ，一开始挺好的，服务一有压力就乱来。只要这些模型出 token 的速度一提升，就知道开始降智了，用了次一档的东西。造成的结果就是写出来非常烂的代码，写出来一个文件，每个函数都是错误的，然后我要给他擦屁股几个小时。这太可怕了，浪费我的大量的时间，去给他他们的模型提供优化数据。还不如老老实实消费 token 去。

15 条回复 • 2025-11-17 13:53:56 +08:00

1

zzutmebwd

12 天前

牛马们如果都有活一多就降低工作质量的觉悟就好了。

2

CC11001100

12 天前

@zzutmebwd 实际上人的负载一旦高了之后出错率就会不由自主的升高，领导们有时候也会靠这个来辅助判断压榨牛马的性能极限。。。

3

musi

12 天前 via iPhone

@CC11001100
jd 上叫抗压能力
面试时叫压力测试

4

Seck

12 天前

听了楼上的 3 层楼，醍醐灌顶，摸鱼摸鱼🖐️🐟️

5

YanSeven

12 天前

什么意思，没看懂，是在说同一个厂商推出的“包月服务”里面的模型会出现降智以次充好的现象，而该厂商的以 api 充值的方式则不会吗。

6

mightofcode

12 天前

自己掌握生产力是多麽重要

7

dbow

OP

12 天前

@YanSeven 包月服务里，厂商有明显的动态调度，节省资源的情况，用次一等规模较小的模型，临时取代规模大的那个，以获得得快的 token 输出，以及服务量，但是输出的代码就差了很多，　小模型不仅 token 成本低，并发服务能力也好的多。

8

kneo

12 天前 via Android

按 token 付费不降智吗？

9

dbow

OP

12 天前

@kneo 部分第三方厂商会用量化版本来忽悠客户，但通常不会用小模型来替代，我觉得花点钱是次要的，出了垃圾代码要我花几小时修正才最恶心。

10

bobohu

12 天前

GLM 4.6 两天我用了 100 万 token ，太可怕了

11

Linioi

12 天前

@bobohu 一百万 token 也就是 1M ，这用量挺小吧，我一小时可能就要好几 M 了。

12

bbbblue

12 天前

minimax m2 套餐不是才刚上吗。。。这么快就试出来降智了？

13

roygong

12 天前 via iPhone

老老实实用 Claude 吧，人家超额是直接停用

14

MIUIOS

11 天前

我现在这个项目，随便一个问题都 1M 了

15

viking602

10 天前

@bobohu 两天才一百万吗 ... 我一上午都 2100w 了

关于 · 帮助文档 · 自助推广系统 · 博客 · API · FAQ · Solana · 5390 人在线 最高记录 6679 ·

Select Language

创意工作者们的社区

World is powered by solitude

VERSION: 3.9.8.5 · 29ms · UTC 03:38 · PVG 11:38 · LAX 19:38 · JFK 22:38
♥ Do have faith in what you're doing.