warkinger 发表于 2025-7-22 09:39:10

Qwen3小更新 Qwen3-235B-A22B-2507

消息来源
https://x.com/Alibaba_Qwen/status/1947344511988076547

快速体验
https://qwq32.com/free-models/qwen-qwen3-235b-a22b-07-25-free


cdlzguo 发表于 2025-7-22 09:39:52

赞一个,超过K2了?

心中只有他 发表于 2025-7-22 09:40:00

步子迈大了,扯着蛋

warkinger 发表于 2025-7-22 09:40:08

cdlzguo 发表于 2025-7-22 09:39
赞一个,超过K2了?

还没体验呢 看跑分是赢

寻找机会 发表于 2025-7-22 09:40:28

<p>simpleQA从12.2一跃到54.3?</p>
<p><img src="data/attachment/forum/202507/22/094025fzvvguhueuuejazg.jpeg" alt="90cc9be59a7663994b860dacc1a285f94b7e4229.jpeg" title="90cc9be59a7663994b860dacc1a285f94b7e4229.jpeg" /></p>

xjdata 发表于 2025-7-22 09:40:43

AI已经进入刷分时代了

longxx888 发表于 2025-7-22 09:40:59

刷分刷的太变态太明目张胆了有点。。。

simpleQA 比 gemini 都高。(而且说了增强长尾知识覆盖,说明数据没打错)

aime25 比部分思考模型都高。。。

有本事把 aider swe 之类刷上去。目前还不如 opus 一根。

萤火虫儿 发表于 2025-7-22 09:41:06

分开是好事,但是部署成本上升了

linkwan 发表于 2025-7-22 09:41:13

赢麻了,就是体验没赢过

weekeight 发表于 2025-7-22 09:41:44

我觉得造假可能性不大,最多也就是题库特化罢了,用qwen的学术界很多,一旦造假很快就会被揭穿

johnwar 发表于 2025-7-22 09:44:32

qwen3用起来还可以,之前一直是带思考,现在不带思考
页: [1]
查看完整版本: Qwen3小更新 Qwen3-235B-A22B-2507