Krman's recent timeline updates
Krman

Krman

V2EX member #227416, joined on 2017-04-23 15:22:25 +08:00
Today's activity rank 22986
Krman's recent replies
2 days ago
Replied to a topic by logoutC 程序员 问一个 Agent 达到 limit 后的操作问题
claude 和 gpt 的 kv cache 主要存储在显存和内存上,所以 ttl 较短,不像 ds 存储在硬盘上可以保存那么久。
TTL:缓存有效期。
2 days ago
Replied to a topic by logoutC 程序员 问一个 Agent 达到 limit 后的操作问题
1.目前好像只有 deepseek 的 kv cache 是存储在硬盘上的,ds 的 kv 缓存 ttl 数小时至几天,在有效的 ttl 内,ds 是按照账户 id 来缓存的。至于开几个 session ,什么时候开 session 对 kv cache 是没有影响的。ttl 过期或者服务器强制清除缓存后,会重新开始计算 kv ;
2.claude 和 gpt 的 kv cache ttl 默认只有 5 分钟,最多可延长到 1h ( token 消耗会增加);
3.kv cache 复用是在 perfill 阶段,切记在 cc 或者其他 coding ide 上的同一 session 中不要随意切换模型( subagent 可以调用任意 llm ,独立的 context ,不会污染主 session 中的 context ,所以也不会破坏 prompt cache ),这样会导致 kv cache 复用失败(原因是不同模型在 perfill 阶段对 qkv 计算维度都不一样);
微信截图 Ctrl+A
前天买的英睿达 240g,今天到,G470 准备满血复活。
@kikyous 老哥 wine 吗?
About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   946 Online   Highest 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 21ms · UTC 22:03 · PVG 06:03 · LAX 15:03 · JFK 18:03
♥ Do have faith in what you're doing.