非常反直觉，GPT-5 Mini 编程效果会比 Opus 4.1 还好。

日常闲聊 · 3 小时前

GPT-5 Mini 以 99% 成绩登顶榜首了。

测试题我看过 Go 的，跟 Aider Ployglot 那一份几乎一致。

https://roocode.com/evals

在 Aider Ployglot 看到一个 5 mini 的 PR ，分数为： 74.2， 略低于 Gemini 2.5 Pro Preview 05-06
初步推断，5 mini 的思考会变笨～

https://github.com/Aider-AI/aider/pull/4467/files

qidi · 3 小时前

倒反天罡，怎么比GPT 5还能思考，还厉害了？

倘若少许天 · 3 小时前

肯定没有啊，现在应该还没有针对大型系统维护的测评吧。毕竟大模型得有像CC这种底座工具，才能去执行系统任务。

NONOPO · 2 小时前

都是一个意思，不然怎么进行量化呢

11111111111@qq · 2 小时前

怎么可能，我不信

		自动登录	找回密码
密码			立即注册

交流非常反直觉，GPT-5 Mini 编程效果会比 Opus 4.1 还好。