Qwen3-Max 来了 —— Qwen 系列迄今为止规模最大、能力最强的模型。

前沿情报 · 5 小时前

Qwen3-Max-Base

Qwen3-Max 模型总参数超过 1T，预训练使用了 36T tokens。模型结构沿用了 Qwen3 系列的模型结构设计范式，使用了 Qwen 团队提出的 global-batch load balancing loss。

Qwen3-Max-Instruct

Qwen3-Max-Instruct 的预览版已在 LMArena 文本排行榜上稳居全球前三。正式发布版本进一步提升了其能力，尤其在代码生成与智能体表现方面表现卓越。
无需思考即可与 SWE-Bench、Tau2-Bench、SuperGPQA、LiveCodeBench 和 AIME25 上的顶级模型相媲美。

Note

在专注于解决现实编程挑战的基准测试 SWE-Bench Verified 上，Qwen3-Max-Instruct 取得了高达 69.6 分的优异成绩，稳居全球顶尖模型之列。
在评估智能体工具调用能力的严苛基准 Tau2-Bench 上，Qwen3-Max-Instruct 更是实现了突破性表现，以 74.8 分超越 Claude Opus 4 与 DeepSeek-V3.1。

Qwen3-Max-Thinking (Heavy)

Tip

Qwen3-Max-Thinking 模型还在训练中

Qwen3-Max 的推理增强版本 —— Qwen3-Max-Thinking，通过集成代码解释器并运用并行测试时计算技术，展现了前所未有的推理能力，尤其在极具挑战性的数学推理基准测试 AIME 25 和 HMMT 上，均取得了满分。

通义千问，点击前往立即体验：https://chat.qwen.ai/

博客（更多详细内容请查看博客文章）：https://qwen.ai/blog?id=241398b9cd6353de490b0f82806c7848c5d2777d&from=research.latest-advancements-list

API 文档： https://alibabacloud.com/help/en/model-studio/models#c2d5833ae4jmo

消息来源：https://x.com/Alibaba_Qwen/status/1970599097297183035

steking · 5 小时前

有点厉害，等大佬测试

甜悦狗 · 5 小时前

这有这么猛？

至冬 · 5 小时前

在最后的思维模型上，
怎么grok4的分数那么高，
但实际编码的时候感觉它特别不好用

leyong · 5 小时前

Qwen3Max也已经在OpenRouter上架

蓝果熊 · 4 小时前

qwen的模型总是给人一种分数挺高，但是用起来平平无奇的感觉

灰情儿 · 4 小时前

蹲一波他的思考模型，希望别像之前的MAX模型那样，写代码的水平特别差

沙漠 · 4 小时前

好多模型w（这段原文似乎比较简短且表意不太明确，看起来无需太多修改就能符合中国人语言习惯，所以保留了原文内容，若你有进一步要求，可再补充说明。）

Shoubuliao · 7 分钟前

迭代速度有点快啊

		自动登录	找回密码
密码			立即注册

新品Qwen3-Max 来了 —— Qwen 系列迄今为止规模最大、能力最强的模型。

Qwen3-Max-Base

Qwen3-Max-Instruct

Qwen3-Max-Thinking (Heavy)

相关帖子

浏览过的版块