1
damontian 2 days ago via Android 哪来的野鸡榜
|
2
jinsongzhaocn OP @damontian 还行吧, 全球最著名的创业孵化器 Y Combinator ( YC ) 2025 年夏季训练营( S25 Batch )的明星毕业项目,并获得了 YC 合伙人的直接支持与早期投资.三个创始人 Grace Li 、Kamryn Ohly 和 Jayden Personnat 肯定都是哈佛毕业的
|
3
mingtdlb 1 day ago
第一 这就有点扯淡了,榜单迟早被国产的玩坏了。目前我认为 claude 和 gpt 是顶级,国产还是有差距
|
4
gloeaerris 1 day ago @mingtdlb 这偏见太深了,又不是国产模型自己去测的,是你外国主子拿模型测的
![]() |
6
wwwwjack 1 day ago
呵呵 看看就好 他们高兴就行, 要是认真就输了
|
7
mingtdlb 1 day ago
@gloeaerris 别急啊 孩子
|
8
alexluo1 1 day ago
@gloeaerris 都违法翻墙了还说这种话
|
9
Rorysky 1 day ago
@gloeaerris 国外这些 KOL 比你想得还要喜欢跟风
|
10
gloeaerris 19h 5m ago
@alexluo1 哦,你违法翻墙出来不是看世界的?居然是来跪舔的啊
大清复活啦 |
11
jinsongzhaocn OP @gloeaerris
@mingtdlb 说偏见有点过了,其实中国家长都这样对自己苛刻,也一代代遗传下来了。 至于玩坏,其实都一样,claude fable 很多测试都以安全为由跳过。公认的 SWE-bench Verified 指标据说居然跳过了几百个,算做通过了,所以才出现了 95%的遥遥领先。这个测试指标里,GLM 完成了 4000 多个测试,fable 完成了 3000 多个。 |