Qwen3小更新 Qwen3-235B-A22B-2507_前沿情报_BigSeek AI社区

warkinger 发表于 2025-7-22 09:39:10

Qwen3小更新 Qwen3-235B-A22B-2507

消息来源
https://x.com/Alibaba_Qwen/status/1947344511988076547

快速体验
https://qwq32.com/free-models/qwen-qwen3-235b-a22b-07-25-free

cdlzguo 发表于 2025-7-22 09:39:52

赞一个，超过K2了？

心中只有他 发表于 2025-7-22 09:40:00

步子迈大了，扯着蛋

warkinger 发表于 2025-7-22 09:40:08

cdlzguo 发表于 2025-7-22 09:39
赞一个，超过K2了？

还没体验呢看跑分是赢

寻找机会 发表于 2025-7-22 09:40:28

<p>simpleQA从12.2一跃到54.3？</p>
<p><img src="data/attachment/forum/202507/22/094025fzvvguhueuuejazg.jpeg" alt="90cc9be59a7663994b860dacc1a285f94b7e4229.jpeg" title="90cc9be59a7663994b860dacc1a285f94b7e4229.jpeg" /></p>

xjdata 发表于 2025-7-22 09:40:43

AI已经进入刷分时代了

longxx888 发表于 2025-7-22 09:40:59

刷分刷的太变态太明目张胆了有点。。。

simpleQA 比 gemini 都高。（而且说了增强长尾知识覆盖，说明数据没打错）

aime25 比部分思考模型都高。。。

有本事把 aider swe 之类刷上去。目前还不如 opus 一根。

萤火虫儿 发表于 2025-7-22 09:41:06

分开是好事，但是部署成本上升了

linkwan 发表于 2025-7-22 09:41:13

赢麻了，就是体验没赢过

weekeight 发表于 2025-7-22 09:41:44

我觉得造假可能性不大，最多也就是题库特化罢了，用qwen的学术界很多，一旦造假很快就会被揭穿

johnwar 发表于 2025-7-22 09:44:32

qwen3用起来还可以，之前一直是带思考，现在不带思考

页: [1]

BigSeek_AI社区_AI论坛's Archiver

Qwen3小更新 Qwen3-235B-A22B-2507