Live code benchmark Pro排名发布,豆包1.6 seed一题未对
难题全是零蛋有点难绷,论文还没看,不知道是不是又搞一堆算法题啊?全0蛋? five 发表于 2025-6-25 09:26
啊?全0蛋?
这个LiveCodeBench Pro前几天看到了,有点抽象的,全是IOI级别的逆天算法题,而且每天换题
但是对实际生产参考意义有多大我不好说 各种排行榜感觉还是要分生产环境的,开发、算法、学习、项目规划等等,代码实力不能一概而论 mahao 发表于 2025-6-25 09:28
这个LiveCodeBench Pro前几天看到了,有点抽象的,全是IOI级别的逆天算法题,而且每天换题
但是对实际生 ...
只能看出模型的上限,和实际体验关系不大? 豆包再弱智不至于肘击不过gemma27b吧,这个榜单我只能说仅供参考了 chaoji 发表于 2025-6-25 09:31
只能看出模型的上限,和实际体验关系不大?
对滴,就是这个意思~ mingren119 发表于 2025-6-25 09:32
豆包再弱智不至于肘击不过gemma27b吧,这个榜单我只能说仅供参考了
Gemma 3 27b 也挺强的,而且 doubao 的思考和非思考差距过重,非思考太拉了 论文算法都不易 慢慢攻克急不得 算法题要把人难哭?
页:
[1]