发帖
 找回密码
 立即注册
搜索
16 0 0
日常闲聊 658 16 2025-8-6 15:36:08
这逻辑分数有点厉害吧
oai我错了
来源:https://www.zhihu.com/question/1 ... 1936391686038230140
──── 0人觉得很赞 ────

使用道具 举报

2025-8-6 15:37:00
就我自己在解题时的体验而言,逻辑能力确实挺不错的,速度也非常快。目前在我的测试用例下,确实不比R10528逊色。

看样子题目有多模态和agent能力
这些东西确实是oai强项,qwen只要一出现多模态就会导致智商降低(信息提取正确但做不对题),可以看我前几天测试的物理

2c70e3581674c6308a40201ea0bc53a28e6ab4be.webp

主要是其他那些家伙测试的结果还不如Qwen,这也太离谱了
2025-8-6 20:08:43
Qwen都能吊打?
这逻辑分数有点厉害吧
oai我错了
来源:远山直(toyama nao 推测的中文名,具体需看实际情况)
2025-8-7 09:24:16
没觉得有多强
2025-8-7 09:53:48
看到标题:笑死我了
看内容:?啊?
2025-8-7 10:01:49
这个参数量还算正常吧,而且还是 fp4
grok4青春开源版?
你说的也有一定的道理
2025-8-8 09:59:36
奥特曼经典梗
2025-8-10 18:24:41
自己亲自测试一下才是硬道理。看站里大佬测试的情况,只有数学能力比较强,其他方面不怎么样
2025-8-11 08:13:43
水军,自己的体验才是最重要的
2025-8-14 10:01:10
我觉得,这得看稳定程度,极限情况还是太少了。
2025-8-18 09:46:31
我知道,所以差点就笑出声了
2025-8-18 12:02:49
甚至还比不上qwen30b呢
2025-8-19 11:00:02
确实牛掰到飞起
您需要登录后才可以回帖 立即登录
高级模式