cwcc's recent timeline updates
cwcc

cwcc

V2EX member #530166, joined on 2021-01-24 11:08:01 +08:00
Today's activity rank 4331
五一的『爱达魔都号』邮轮返程回来,说一下体验
旅行  •  cwcc  •  May 7, 2025  •  Lastly replied by cwcc
30
有办法把中国联通的“欢迎使用中国联通业务”屏蔽?
iPhone  •  cwcc  •  Jan 11, 2025  •  Lastly replied by bao3
24
MacBook Air M2 好像有硬件问题
MacBook  •  cwcc  •  Apr 8, 2025  •  Lastly replied by lsvl
1
cwcc's recent replies
1 day ago
Replied to a topic by YanSeven Claude Code claude code 突然日文跟我对话
我用 Copilot 的 Claude 模型也是会有这个问题,感觉像是模型的问题。
@YanSeven 显卡+主机不好移动啊。
4 days ago
Replied to a topic by Karlbaey 问与答 国内的企业是压根不在乎域名吗
@tars13344 结果阿里还把饿了么改名淘宝闪购了
4 days ago
Replied to a topic by Karlbaey 问与答 国内的企业是压根不在乎域名吗
感觉 pointer 开发 web 应用更加习惯,如果使用 web 开发桌面应用的话 pointer 能省则省。
DeepSeek 叫 DeepSeek ,不叫 WideSeek ,说明了什么。
不是算力的问题,是显存太紧张了,只能跑个 7b 左右的才能达到每秒 70-100tok 的速度,跑更大模型受限的情况瓶颈基本全在 PCIe 带宽和显存上。

真要横向比较的话,我自己的 36G 的 MacBook Pro 能跑 qwen3.6035b-a3b 模型,每秒能到 30token ,但长上下文直接把内存撑爆死机;相比我的 5060Ti 只能直接跑小模型,或者 CPU 混合计算下利用 64G 的 RAM 能以很慢的速度跑很大的模型也不会爆内存死机。总之各有各的瓶颈,你得知道自己的硬件瓶颈在哪里。
说白了还是要解决一个 Agent 的根本问题:有限的显存空间和膨胀的上下文之间的问题。不过模型的拆分确实能更好地解决一个复杂项目下上下文爆炸的问题,不管是大模型还是小模型。这点我甚至感觉可以通过优化现有的 Copilot 、Copilot 、Roo Code 等 prompt 和 tool call 实现,比如加入 subagent 、优化子项目流程、自动 compact context 等。
早上班早下班比晚上班晚下班其实更舒服,早点睡就好了。
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   977 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 24ms · UTC 22:05 · PVG 06:05 · LAX 15:05 · JFK 18:05
♥ Do have faith in what you're doing.