V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
soleils
V2EX  ›  程序员

GLM4.7 出了 Coding 套餐也可以用

  •  
  •   soleils · Dec 22, 2025 · 3409 views
    This topic created in 130 days ago, the information mentioned may be changed or developed.
    GLM-4.7 在编程、推理与智能体三个维度实现了显著突破:
    编程能力:在 LMArena Code Arena 盲测中位列开源第一、国产第一,超过 GPT-5.2 ;在 SWE-bench-Verified 获得国产第一;在 LiveCodeBench V6 达到 84.8 的开源 SOTA 分数,超过 Claude Sonnet 4.5 。

    推理能力:在 AIME 2025 数学竞赛中取得开源 SOTA ,超过 Claude Sonnet 4.5 和 GPT-5.1 ;在 HLE (“人类最后的考试”)基准测试中获得 42% 的成绩,较 GLM-4.6 提升 38% ,接近 GPT-5.1

    智能体能力:在 BrowseComp 网页任务评测中获得 67 分;在 τ²-Bench 真实世界交互评测中实现开源 SOTA ,接近 Claude Sonnet 4.5 ( 84.7 分)
    4 replies    2025-12-24 11:34:26 +08:00
    headwindx
        1
    headwindx  
       Dec 23, 2025 via iPhone
    swe 得分多少? 发地址吧
    wweir
        2
    wweir  
       Dec 23, 2025
    所以,昨天我调用 Lite 套餐的模型,就各种幺蛾子
    soleils
        3
    soleils  
    OP
       Dec 23, 2025
    byteLoading
        4
    byteLoading  
       Dec 24, 2025
    lite 太拉,pro 太贵
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2373 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 31ms · UTC 04:24 · PVG 12:24 · LAX 21:24 · JFK 00:24
    ♥ Do have faith in what you're doing.