aikilan
V2EX  ›  OpenAI

GPT 5.5 的降智是不是有点严重

  •  
  •   aikilan · 14h 52m ago · 3514 views

    最近任务往往需要引导 2 次以上,稍微复杂点的引导 3-4 次都有,太奇怪了

    31 replies    2026-05-21 16:35:10 +08:00
    sockpuppet9527
        1
    sockpuppet9527  
       14h 31m ago
    +1

    怀疑是新模型发布前后,算力被重新分配。
    aikilan
        2
    aikilan  
    OP
       14h 20m ago
    @sockpuppet9527 完全属于被服务商拿捏的
    YanSeven
        3
    YanSeven  
       14h 15m ago
    前几天一片夸 codex gpt 5.5 爆杀 claude code 的。

    看来 MaaS 这东西,比传统的各种 aaS 都要不稳定。
    MrL21
        4
    MrL21  
       14h 12m ago
    是的,变差了很多
    ximaoyang
        5
    ximaoyang  
       14h 9m ago
    gpt 聪明过吗?在 cc 面前就是个垃圾
    shunia
        6
    shunia  
       14h 8m ago
    啥问题?昨天在 vscode 和 cli 里都用了,感觉还是一样,能力上没啥变化啊?
    不过出了个新 bug 就是,有一个项目一直触发 cybersecurity 的提示,没法用。去 codex 的 issue 里看了一眼,提的 issue 都被直接关了,也不处理。
    shunia
        7
    shunia  
       14h 8m ago
    @ximaoyang #5 ??这是从何说起?
    409164
        8
    409164  
       14h 7m ago via iPhone
    @ximaoyang 确实
    lel020
        9
    lel020  
       14h 6m ago
    我以前用 medium 的,现在用 xhigh ,起码没比以前的 medium 降智,
    tanrenye
        10
    tanrenye  
       14h 3m ago
    没觉得降智,工作的任务都能胜任
    ktyang
        11
    ktyang  
       14h 2m ago
    是的,昨天一个小工具翻来覆去搞了好几遍,每次都有问题,害得我折腾了好久,以前肯定是一次成的。
    lemontrees
        12
    lemontrees  
       13h 57m ago
    感觉还好
    YangJiLei
        13
    YangJiLei  
       13h 56m ago
    昨天不是额度偷偷刷新吗,我感觉现在额度消耗的好快
    Yasuke
        14
    Yasuke  
       13h 56m ago
    @ximaoyang 你真的用过吗
    laved
        15
    laved  
       13h 50m ago
    @ximaoyang 我用 copilot 的时候用过 cc 反而觉得 cc 比不上 gpt
    sockpuppet9527
        16
    sockpuppet9527  
       13h 20m ago
    @aikilan 之前 opus 4.7 发布前夕,opus 4.6 降智也很厉害。祖传手艺了算是。
    wy315700
        17
    wy315700  
       13h 17m ago
    @YangJiLei 降智,额度变少

    都是基操了
    undefine2020
        18
    undefine2020  
       13h 16m ago
    5.4 也降了,昨天第一次碰到让它改个 shell 脚本都出问题的
    urfree
        19
    urfree  
       12h 48m ago
    5.6 要来了吧
    evemoo
        20
    evemoo  
       12h 46m ago
    +1 ,胶水代码特别多,简单功能搞得特别复杂
    yuyue001
        21
    yuyue001  
       12h 38m ago
    除了 claude ,有哪个值得推荐的模型,和 gpt 互补使用。现在降智的很难受。
    ximaoyang
        22
    ximaoyang  
       11h 33m ago
    除了 cc 其他的都别用。cc 回答简短。不知道就说不知道。gpt 那套真扛不住,回答特别长,不懂瞎回答。真的到干活的时候就来回的在一个地方打转。
    Zarhani
        23
    Zarhani  
       10h 25m ago
    连 openrouter 上的 api 也降智了
    isnullstring
        24
    isnullstring  
       10h 13m ago
    +1 ,今天写的计划和代码开始变得弱智起来,自己定的计划却不按计划来
    aikilan
        25
    aikilan  
    OP
       10h 5m ago
    @isnullstring 之前经常输出的计划能够把我没注意到的也列出来。。。现在提问频率降低,输出的东西就是一大坨
    Baymaxbowen
        26
    Baymaxbowen  
       9h 55m ago
    +1 ,一个小项目经常丢三落四的
    v2306
        27
    v2306  
       9h 54m ago
    更新完,上下文窗口的进度条怎么没有了
    fuchish112
        28
    fuchish112  
       9h 30m ago
    咋一个个跟着手机厂商学,新的出来,旧的就故意卡顿,降拍照画质等等手段
    bellx
        29
    bellx  
       9h 30m ago
    是的,之前一遍过的东西现在要返工,我用的还是 5.5 xhigh
    cirzear
        30
    cirzear  
       9h 14m ago
    @bellx 同感,同样复杂度的任务,现在总是只改差不多就说改完了,闭环逻辑也不如之前,需要‘鞭子抽它’才去一步步干
    isnullstring
        31
    isnullstring  
       7h 52m ago
    @aikilan 是的,代码里已经有相应变量,代码也是他自己写的,写计划时候又创建个相同含义的变量,那计划我审得恼火 丢给 opus 审,审出 10 个问题 5 个严重问题
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1630 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 74ms · UTC 16:27 · PVG 00:27 · LAX 09:27 · JFK 12:27
    ♥ Do have faith in what you're doing.