V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
viskem
V2EX  ›  程序员

从 2 月开始用 Opus 4.6,到这几天切到 4.7,一些感悟和困惑

  •  
  •   viskem · Apr 22 · 1619 views

    陆陆续续花了上万 RMB ,攒了点心得,也攒了一堆困惑。

    1 、MAX 和 HIGH 之间的边界,一直摸不太清。

    不知道什么场景下用 HIGH 就够了。让它帮我调个版式,HIGH 确实 OK ,但聊着聊着就会延伸到架构、流程优化——那这时候我是不是得立马切 MAX ?大家遇到这种"任务中途升级"的情况,是怎么处理的?

    2 、MAX 也并不是万能的。

    大大小小的问题照样会出,尤其是面对复杂工程,或者它对别人写的引擎理解不到位的时候,反复出错,找不到根因,而且确实绕不过一些弯子,也找不到那些非常有"灵感"、比较 Hack 向的手法。

    3 、可能之前对"Agent 全自动化流程"有个误解。

    后来才意识到:Agent 参与的全自动化流程,本质上约等于人工参与的流程,它一样会犯错,一样需要兜底。所以我认为 Agent 更应该帮我沉淀出连 Agent 都不必介入的稳定 flow 。

    4 、上下文( context )的重要性,远比我想象的更关键。

    钱花到一定程度才愈发觉得 context 很混乱(我总是让 OPUS 自动帮我考虑 context 该如何优化)。尤其是 4.6 切到 4.7 这段时间,把之前的错误全部纠正了一遍,才意识到——也许我多花了 50% 的经费?

    5 、多设备 / 多 Agent / 多 Session 协作方案,大家是怎么搭的?

    我目前的配置是:Air 作为移动工作平台,办公室里 2 台 PC + 1 台 Mac mini ,4 台机器协同作业。想听听大家的架构和经验,有没有什么值得借鉴的玩法?

    顺便,OPUS 真的太贵了,想转战性价比了,因为 context 、skill 都铺了个大概,现在也对 OPUS 顶配祛魅了。大家给点推荐!

    模型像员工,我真不一定要溢价用最高级的。好的流程和规范,还是能让具备基本水平的 Agent 做出有价值的项目;而真正需要突破性能力的环节,当下所谓"顶配"模型其实也不见得比次一档高出多少。

    (可能略显愚笨,望轻喷)

    Supplement 1  ·  Apr 23
    刚才换回 4.6 ,感觉稍微好了一点点,但也迟迟没帮我解决一个 Unity 的 AssetsBundle 相关的问题。

    索性中途换了 GPT5.4 ,结果那吐字的速度没把我给憋死,索性又换了 Gemini3.1pro……

    哈哈哈……它就一直在查看一段超长日志,换着各种花样查询,我足足看了 20 多种查询,它还在往死里查……

    4.6……还是只能靠你了!(哈哈哈,笑死我了……
    10 replies    2026-04-24 11:32:08 +08:00
    maocat
        1
    maocat  
       Apr 22
    我只有 2 个经验:
    1. 善用/compact xxx, 为接下来的工作做准备
    2. 总结成功的动作,如获取 token 过程,项目运行重启方式等等
    940i3s34v4F1HW41
        2
    940i3s34v4F1HW41  
    PRO
       Apr 22
    我的使用经验:
    1.想要更好的效果,等
    2.没了
    0x0x
        3
    0x0x  
       Apr 22
    陆陆续续花了上万 RMB ? 这是一直在用 api ?
    大部分人没你玩的这么 6 ,只是单一设备通过 ai 来提效而已。
    目前使用 opus 的主要一个比较好的体验是:通过 plan 指定好计划后,基本上能够正常跑完整个流程,同时最终的代码是可以直接编译的(不是没有 bug ,bug 还要 review 然后让 ai 继续修或者自己修)
    其他的模型可能会偷懒,没有编译过就放弃了,然后继续修改代码。 最终的成品是无法编译的
    jjymup1
        4
    jjymup1  
       Apr 22
    我们都捡路边的垃圾吃,大佬是真大佬啊!!
    sampeng
        5
    sampeng  
       Apr 22 via iPhone   ❤️ 1
    你要用 4.6 的关闭自动推断思考程度才有效,4.7 的 max 是路边一条。你试试 4.6 关闭了强制 max 和最大思考 token 。除了慢,还是我们熟悉的那个 opus
    alexfu
        6
    alexfu  
       Apr 23
    最近 200 刀的 plan 4.7 都不够用 5 天就爆周限额 而且天天搁那 check malware 感觉是越来越拉了
    同求便宜的替代
    viskem
        7
    viskem  
    OP
       Apr 23
    @sampeng …………兄弟,谢谢你,当我 4.7 越用越绝望的时候……我换到了你说的那样,似乎真的找回了一些感觉!你说的最大思考是指 thinking 模式 还是 1M 上下文?
    sampeng
        8
    sampeng  
       Apr 24 via iPhone   ❤️ 1
    @viskem
    "env": { "CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING": 1, "MAX_THINKING_TOKENS": "128000"


    然后思考等级最少是 high ,特别难得地方用 max 。我用 high 就够了。
    sampeng
        9
    sampeng  
       Apr 24 via iPhone   ❤️ 1
    @viskem 不要用满 1M 上下文。我设置到自动压缩 400k 。
    "DISABLE_AUTOUPDATER": "1",
    "ENABLE_TOOL_SEARCH": "auto:0.4",
    "CLAUDE_AUTOCOMPACT_PCT_OVERRIDE": "40",

    400k 以上后严重有问题。当然 300k 可能是最好的,我基本只用到 300k 。
    viskem
        10
    viskem  
    OP
       Apr 24
    @sampeng 谢谢!我尝试用了一天 sonnet4.6 high ,意外还行?
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2889 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 52ms · UTC 07:21 · PVG 15:21 · LAX 00:21 · JFK 03:21
    ♥ Do have faith in what you're doing.