V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
dbow
V2EX  ›  程序员

最近取消订阅了多家厂商的包月 token 服务,现在纯按 token 量消费, 因为它们都有降智问题。

  •  
  •   dbow ·
    maliubiao · 12 天前 · 2643 次点击

    主要的问题是这些厂商,它的后台的模型并不总是用了它的主力的模型,会在后台降智。
    智谱的这个 GLM 4.6 ,新出的 Minimax M2 ,一开始挺好的,服务一有压力就乱来。 只要这些模型出 token 的速度一提升,就知道开始降智了,用了次一档的东西。 造成的结果就是写出来非常烂的代码,写出来一个文件,每个函数都是错误的,然后我要给他擦屁股几个小时。 这太可怕了,浪费我的大量的时间,去给他他们的模型提供优化数据。 还不如老老实实消费 token 去。

    15 条回复    2025-11-17 13:53:56 +08:00
    zzutmebwd
        1
    zzutmebwd  
       12 天前
    牛马们如果都有活一多就降低工作质量的觉悟就好了。
    CC11001100
        2
    CC11001100  
       12 天前
    @zzutmebwd 实际上人的负载一旦高了之后出错率就会不由自主的升高,领导们有时候也会靠这个来辅助判断压榨牛马的性能极限。。。
    musi
        3
    musi  
       12 天前 via iPhone
    @CC11001100
    jd 上叫抗压能力
    面试时叫压力测试
    Seck
        4
    Seck  
       12 天前
    听了楼上的 3 层楼,醍醐灌顶,摸鱼摸鱼🖐️🐟️
    YanSeven
        5
    YanSeven  
       12 天前
    什么意思,没看懂,是在说同一个厂商推出的“包月服务”里面的模型会出现降智以次充好的现象,而该厂商的以 api 充值的方式则不会吗。
    mightofcode
        6
    mightofcode  
       12 天前
    自己掌握生产力是多麽重要
    dbow
        7
    dbow  
    OP
       12 天前
    @YanSeven 包月服务里,厂商有明显的动态调度,节省资源的情况,用次一等规模较小的模型,临时取代规模大的那个,以获得得快的 token 输出,以及服务量,但是输出的代码就差了很多, 小模型不仅 token 成本低,并发服务能力也好的多。
    kneo
        8
    kneo  
       12 天前 via Android
    按 token 付费不降智吗?
    dbow
        9
    dbow  
    OP
       12 天前
    @kneo 部分第三方厂商会用量化版本来忽悠客户,但通常不会用小模型来替代,我觉得花点钱是次要的,出了垃圾代码要我花几小时修正才最恶心。
    bobohu
        10
    bobohu  
       12 天前
    GLM 4.6 两天我用了 100 万 token ,太可怕了
    Linioi
        11
    Linioi  
       12 天前
    @bobohu 一百万 token 也就是 1M ,这用量挺小吧,我一小时可能就要好几 M 了。
    bbbblue
        12
    bbbblue  
       12 天前
    minimax m2 套餐不是才刚上吗。。。这么快就试出来降智了?
    roygong
        13
    roygong  
       12 天前 via iPhone
    老老实实用 Claude 吧,人家超额是直接停用
    MIUIOS
        14
    MIUIOS  
       11 天前
    @bobohu 我现在这个项目,随便一个问题都 1M 了
    viking602
        15
    viking602  
       10 天前
    @bobohu 两天才一百万吗 ... 我一上午都 2100w 了
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   5390 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 03:38 · PVG 11:38 · LAX 19:38 · JFK 22:38
    ♥ Do have faith in what you're doing.