实测:Kimi2.7 很拉!且 Token 消耗增高而不是所谓的减少 30%
自媒体上一群鼓吹实测的,都是胡扯。
第一:并没有感觉明显增强!
第二:明显感觉消耗 token 剧增!
一个任务消耗了我 10%的 5 小时额度,我还是 Allegretto 级的会员,已反馈给 Kimi 官方
实测:Kimi2.7 很拉!且 Token 消耗增高而不是所谓的减少 30%
自媒体上一群鼓吹实测的,都是胡扯。
第一:并没有感觉明显增强!
第二:明显感觉消耗 token 剧增!
一个任务消耗了我 10%的 5 小时额度,我还是 Allegretto 级的会员,已反馈给 Kimi 官方
1
stabc 1 day ago
我自己有一个项目专门保存了一个分支用来测试 AI 能力,目前国产模型测下来只有 GLM5.1 合格,gpt5.5 只有 high 和 xh 合格。kimi2.7 今天也测试了不合格。
|
2
ppboyhai OP |
3
coderfee 1 day ago via iPhone
看自媒体测大模型属于自己往坑里跳。对任何大吹特吹的模型都保持质疑。
|
4
xiaolanger 1 day ago
@stabc #1 opus 哪个版本更好?
|
5
stabc 1 day ago
@xiaolanger oppus 我忘了当时测的哪个了,反正是通过了。但是 sonnet 不通过。
|
6
Chenliang2 1 day ago
多模态是不是还不支持?
|
7
hobbyliu 1 day ago 实测 k2.7 能力和 k2.6 差不多而且特别懒,用 k2.7 搞一个功能升级各种推脱说改动会导致系统风险性提高,交给 glm5.1 二话不说 20 分钟给搞的明明白白的。
|
8
SiWXie 1 day ago via iPhone
和我体验一样,简单的任务 2.7 也需要想很久,我还以为是 claude code 升级导致的,看来是通病。昨天跑了 5 个任务,用了大概一个月 30%左右的 199 套餐额度,推理过程刚开始是中文,后面变成英文,再后面变成中文,很奇怪
|
9
guichen 1 day ago
@stabc 找到同党了,我也有几个分支专门测试 AI 能力的,目前来看 glm5.1 代码风格不错,适合写新增代码,gpt 的工具调用和逻辑能力很强,适合重构代码,联调修 bug 。
价格便宜的模型用起来不一定便宜,chatgpt10 分钟跑通的一个测试,glm5.1 烧了 4 千万 token 把 5 小时限额用完了都没跑通。。glm 还是国产模型里面测试结果最好的 |
11
ericguo 1 day ago
有没有一种可能,我是说一种可能,kimi 2.7 其实还在测试中( kimi-for-coding 上写了,beta 计划自愿参加)……
|
13
haiku 1 day ago via Android
等 glm-5.2
|
15
suexiy 1 day ago via iPhone
全是商广
|
17
youngxhui 1 day ago
目前看额度消耗的确变大了
|
19
micean 15h 17m ago
不知道其他模型会不会,我觉得 kimi 最恐怖的地方就是写坏了就 git checkout
|