发帖
 找回密码
 立即注册
搜索
7 4 0
前沿情报 49 7 昨天 09:23
难题全是零蛋有点难绷,论文还没看,不知道是不是又搞一堆算法题
61113f22600571ccee3ed3d6bd91645ccf0a30e0.jpeg

──── 4人觉得很赞 ────

使用道具 举报

昨天 09:26
啊?全0蛋?
mahao
昨天 09:28
这个LiveCodeBench Pro前几天看到了,有点抽象的,全是IOI级别的逆天算法题,而且每天换题 但是对实际生产参考意义有多大我不好说  详情 回复

这个LiveCodeBench Pro前几天看到了,有点抽象的,全是IOI级别的逆天算法题,而且每天换题

但是对实际生产参考意义有多大我不好说
chaoji
昨天 09:31
只能看出模型的上限,和实际体验关系不大?  详情 回复
各种排行榜感觉还是要分生产环境的,开发、算法、学习、项目规划等等,代码实力不能一概而论
mahao 发表于 2025-6-25 09:28
这个LiveCodeBench Pro前几天看到了,有点抽象的,全是IOI级别的逆天算法题,而且每天换题

但是对实际生 ...

只能看出模型的上限,和实际体验关系不大?
mahao
昨天 09:56
对滴,就是这个意思~  详情 回复
豆包再弱智不至于肘击不过gemma27b吧,这个榜单我只能说仅供参考了
ouyang2008
昨天 09:56
Gemma 3 27b 也挺强的,而且 doubao 的思考和非思考差距过重,非思考太拉了  详情 回复
chaoji 发表于 2025-6-25 09:31
只能看出模型的上限,和实际体验关系不大?

对滴,就是这个意思~
mingren119 发表于 2025-6-25 09:32
豆包再弱智不至于肘击不过gemma27b吧,这个榜单我只能说仅供参考了

Gemma 3 27b 也挺强的,而且 doubao 的思考和非思考差距过重,非思考太拉了
您需要登录后才可以回帖 立即登录
高级模式