实测： Kimi2.7 很拉！且 Token 消耗增高而不是所谓的减少 30%

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

实测：Kimi2.7 很拉！且 Token 消耗增高而不是所谓的减少 30%

自媒体上一群鼓吹实测的，都是胡扯。

第一：并没有感觉明显增强！

第二：明显感觉消耗 token 剧增！

一个任务消耗了我 10%的 5 小时额度，我还是 Allegretto 级的会员，已反馈给 Kimi 官方

实测

token

消耗

20 replies • 2026-06-15 11:36:38 +08:00

stabc

1 day ago

我自己有一个项目专门保存了一个分支用来测试 AI 能力，目前国产模型测下来只有 GLM5.1 合格，gpt5.5 只有 high 和 xh 合格。kimi2.7 今天也测试了不合格。

ppboyhai

1 day ago

![图片]( https://picui.ogmua.cn/s1/2026/06/13/6a2d763e92565.webp)

我不到半小时花了 86%的 5 小时额度。而且还没有并发任务，太恐怖了

coderfee

1 day ago via iPhone

看自媒体测大模型属于自己往坑里跳。对任何大吹特吹的模型都保持质疑。

xiaolanger

1 day ago

@stabc #1 opus 哪个版本更好？

stabc

1 day ago

@xiaolanger oppus 我忘了当时测的哪个了，反正是通过了。但是 sonnet 不通过。

Chenliang2

1 day ago

多模态是不是还不支持?

hobbyliu

1 day ago

实测 k2.7 能力和 k2.6 差不多而且特别懒，用 k2.7 搞一个功能升级各种推脱说改动会导致系统风险性提高，交给 glm5.1 二话不说 20 分钟给搞的明明白白的。

SiWXie

1 day ago via iPhone

和我体验一样，简单的任务 2.7 也需要想很久，我还以为是 claude code 升级导致的，看来是通病。昨天跑了 5 个任务，用了大概一个月 30%左右的 199 套餐额度，推理过程刚开始是中文，后面变成英文，再后面变成中文，很奇怪

guichen

1 day ago

@stabc 找到同党了，我也有几个分支专门测试 AI 能力的，目前来看 glm5.1 代码风格不错，适合写新增代码，gpt 的工具调用和逻辑能力很强，适合重构代码，联调修 bug 。
价格便宜的模型用起来不一定便宜，chatgpt10 分钟跑通的一个测试，glm5.1 烧了 4 千万 token 把 5 小时限额用完了都没跑通。。glm 还是国产模型里面测试结果最好的

guichen

1 day ago

@guichen 纠正下，那个测试 gpt5.5xh 跑了 20 分钟通了，glm5.1+claudecode 跑了 2 小时没通限额了