发帖
 找回密码
 立即注册
搜索
0 0 0
日常闲聊 334 0 3 小时前

GPT-5 Mini 以 99% 成绩登顶榜首了。
f094f93a0428c44f13fae32a0eb790fba7f1d8b5.webp
测试题我看过 Go 的,跟 Aider Ployglot 那一份几乎一致。

https://roocode.com/evals


在 Aider Ployglot 看到一个 5 mini 的 PR ,分数为: 74.2, 略低于 Gemini 2.5 Pro Preview 05-06
初步推断,5 mini 的思考会变笨~

https://github.com/Aider-AI/aider/pull/4467/files

──── 0人觉得很赞 ────

使用道具 举报

倒反天罡,怎么比GPT 5还能思考,还厉害了?
肯定没有啊,现在应该还没有针对大型系统维护的测评吧。毕竟大模型得有像CC这种底座工具,才能去执行系统任务。
都是一个意思,不然怎么进行量化呢
怎么可能,我不信
您需要登录后才可以回帖 立即登录
高级模式