Qwen3小更新 Qwen3-235B-A22B-2507
消息来源https://x.com/Alibaba_Qwen/status/1947344511988076547
快速体验
https://qwq32.com/free-models/qwen-qwen3-235b-a22b-07-25-free
赞一个,超过K2了? 步子迈大了,扯着蛋 cdlzguo 发表于 2025-7-22 09:39
赞一个,超过K2了?
还没体验呢 看跑分是赢 <p>simpleQA从12.2一跃到54.3?</p>
<p><img src="data/attachment/forum/202507/22/094025fzvvguhueuuejazg.jpeg" alt="90cc9be59a7663994b860dacc1a285f94b7e4229.jpeg" title="90cc9be59a7663994b860dacc1a285f94b7e4229.jpeg" /></p>
AI已经进入刷分时代了 刷分刷的太变态太明目张胆了有点。。。
simpleQA 比 gemini 都高。(而且说了增强长尾知识覆盖,说明数据没打错)
aime25 比部分思考模型都高。。。
有本事把 aider swe 之类刷上去。目前还不如 opus 一根。 分开是好事,但是部署成本上升了 赢麻了,就是体验没赢过 我觉得造假可能性不大,最多也就是题库特化罢了,用qwen的学术界很多,一旦造假很快就会被揭穿 qwen3用起来还可以,之前一直是带思考,现在不带思考
页:
[1]