发帖
 找回密码
 立即注册
搜索
6 4 0
日常闲聊 57 6 11 小时前
4.1以上(其实算是表现最好的了)
4fbacecc219969f51979769c404b3e73d43281e5.jpeg

03pro:
32163ce21cbe681d1380a1b449c8e21db7714fe3.jpeg
4412a92c0b5281e23053f04654c2d561322932e5.jpeg
从22:50卡到8:50
目前已测试模型:克劳德3.7 豆包t 通义235b m1 微软copilot(不思考) GPT所有模型(除4.5) deepseek v3 r1
Gemini没测!



──── 4人觉得很赞 ────

使用道具 举报

好家伙,这是没有08年之前的训练语料了吧

正确答案应该是galgame,心里全是小黄油
亲测,claude全军覆没
豆包思考都已经有正确答案了,莫名其妙的思路一歪,完美错过 wechat_2025-06-23_102024_040.png

我宣布grok最菜! 49ec501978075c67e7af16639310d85a79f2d631.webp
twinsbbs
11 小时前
这可太菜了....完全不沾边,老马不喂我们China的物料吗  详情 回复
11 小时前
lihanyue 发表于 2025-6-23 10:22
我宣布grok最菜!

这可太菜了....完全不沾边,老马不喂我们China的物料吗
您需要登录后才可以回帖 立即登录
高级模式