V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
qdwang
V2EX  ›  分享发现

glm 5 和 minimax m2.5 都挺菜的

  •  1
     
  •   qdwang · 7 小时 47 分钟前 · 1465 次点击

    问题:我想去洗车,洗车店距离我家 50 米,考虑到环保,你说我应该骑车去还是开车去?(注意陷阱)


    都是 API 测试,我都提示他们有陷阱了,还做不对。


    glm 5 回答:走路去。陷阱在于:题目故意只给你两个选项(骑车或开车),诱导你在两个都不合适的选项中纠结,让你忽略了最简单、最环保的方案——走路。

    minimax m2.5 回答:骑车去。原因很简单:你目的是去洗车,等你到了洗车店,车就要被清洗了。如果你开车去,到达时车已经是脏的,还要把脏车停在洗车店,这完全多此一举。

    Kimi K2.5 回答:开车去。你要洗车,就必须把车带到洗车店。


    大家可以试试

    27 条回复    2026-02-14 16:59:44 +08:00
    YanSeven
        1
    YanSeven  
       7 小时 34 分钟前
    国内这几家小的在算力,用户(用户数据)上都比不上美国那三家。菜是必然的,除非真在核心架构上鼓捣出高级的东西。

    便宜+能覆盖部分低级场景就行。就好像一个低级开发,工作经验+给的工资本来就没那么多,表现一般合情合理。

    有发展的后劲就行。
    Dabney
        2
    Dabney  
       7 小时 34 分钟前
    glm 5 还是聪明,给你第三个选择 🤣
    dfdd1811
        3
    dfdd1811  
       7 小时 34 分钟前
    deepseek:建议你骑车去洗车。
    豆包:环保必须骑车或不行,要不要帮你计算一下汽车冷启动一次的油耗。
    我看是国产模型全军覆没吧。
    gemini 上来就识别出来是“逻辑挑战”不知道是真聪明,还是被问过。
    MagicalCarl
        4
    MagicalCarl  
       7 小时 11 分钟前
    Kimi K2.5
    qdwang
        5
    qdwang  
    OP
       7 小时 8 分钟前 via iPhone
    @Dabney 还真是
    foryou2023
        6
    foryou2023  
       7 小时 8 分钟前
    我测试过 ds ,我的是开车去,但是看到不少其他人的是走过去。
    qdwang
        7
    qdwang  
    OP
       7 小时 8 分钟前 via iPhone
    @MagicalCarl 哈哈哈 确实环保
    soulflysimple123
        8
    soulflysimple123  
       6 小时 57 分钟前
    测了个 glm5,思考了一大推最后总结如下:
    总结:
    如果是去送车洗,请开车(物理刚需);如果是人过去,请步行( 50 米骑车纯属多此一举)。最环保的方案是:下次直接在手机上下单“上门洗车”。


    我想去洗车,洗车店距离我家 50 米,... →点击查看智谱清言的回答
    https://chatglm.cn/share/AFcRP0ML
    shm7
        9
    shm7  
       6 小时 36 分钟前
    每次结果都不同,我试了 kimi qwen doubao ds ,qwen 和 ds 是可以的
    qqqasdwx
        10
    qqqasdwx  
       6 小时 19 分钟前
    啊?不是说 glm5 能和 claude sonnet 4.5 打平吗
    catazshadow
        11
    catazshadow  
       6 小时 19 分钟前 via Android
    @YanSeven 没后劲的,被制裁没算力就罢了,捂嘴干死数据量是无解的
    woodongwong
        12
    woodongwong  
       6 小时 15 分钟前
    gpt5.3 codex xhigh 都能回答错,但是你不得否认它撸码确实强。
    jackchenly
        13
    jackchenly  
       6 小时 3 分钟前
    刚才问 deepseek 回答对了
    jackchenly
        14
    jackchenly  
       6 小时 3 分钟前
    @jackchenly 考虑到你要洗的是汽车,而洗车店距离你家只有 50 米,你只有开车才能把车送到洗车店。如果骑车去,汽车还停在家里,无法完成洗车。因此,从实际需求出发,你必须开车去。虽然开车会产生排放,但距离很短,影响较小。这就是问题中的陷阱:环保考量不能忽视洗车的必要性。
    redbule
        15
    redbule  
       5 小时 20 分钟前 via Android
    @catazshadow 这是什么 rz 案例啊,和 coding 一毛钱关系都没有
    Liftman
        16
    Liftman  
       4 小时 46 分钟前
    自娱自乐。聊以慰藉。咱的特色。上面有文件,天天都有阵风。很烦的。
    xiaoz
        17
    xiaoz  
       4 小时 30 分钟前   ❤️ 3
    拿一个单一的问题来对比测试是否过于片面性?
    xiaoliuzhenshuai
        18
    xiaoliuzhenshuai  
       3 小时 31 分钟前
    刚才问 deepseek 回答错了,千问对了也是因为引用读了已经得答案(因为有很多这个问题了),gemini ,Claude ,chatgpt 没问题
    Rrrrrr
        19
    Rrrrrr  
       3 小时 9 分钟前
    最后一个,恐怕是修正后的回答
    xxlsize
        20
    xxlsize  
       3 小时 5 分钟前
    我只关心 coding 能力
    lixintcwdsg
        21
    lixintcwdsg  
       2 小时 54 分钟前
    @MagicalCarl 应该自动埋了提示词,运营随时抓这种热点来补
    Massif5279
        22
    Massif5279  
       2 小时 23 分钟前

    试了几个模型,就 gemini 答对了
    zerovoid
        23
    zerovoid  
       2 小时 10 分钟前
    这问题用这个来测试 AI ,感觉没啥意义,对 AI 来说,洗车必须带着自己的车去洗车店,这估计不是一个常识。
    而且以后网上这类问题多了,AI 学了也就都会回答了。
    murmur
        24
    murmur  
       1 小时 49 分钟前
    有没有可能,国内有家用洗车机,人力成本也便宜,AI 可以让你找人上门洗车

    “你本来就是去洗车,再开过去一趟,路上又会沾灰,等于白洗一小半。”

    豆包说的有道理,刚洗完车 50 米就开回家,太折腾了,还不如下次出远门再洗
    leena
        25
    leena  
       1 小时 32 分钟前 via iPhone
    没说让你扛着去就算好的了,还骑车去,😂😂😂
    atrexl
        26
    atrexl  
       1 小时 25 分钟前 via Android
    @YanSeven 又反思上了。试了一下 grok 和 gemini ,一样答的乱七八糟。
    jimrok
        27
    jimrok  
       1 小时 0 分钟前
    稍微复杂点代码,我试了 GLM 和 minimax 都比较菜,GLM 还执行的很慢,浪费钱的玩意,一些代码 minimax 修复不了,还得换其他模型来解决。现阶段编程生产力应该只看 google 和 claud ,国产必须突破弱智这个点后,才能成为生产力工具,这个不是靠嘴炮能解决的。
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2097 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 10:00 · PVG 18:00 · LAX 02:00 · JFK 05:00
    ♥ Do have faith in what you're doing.