发帖
 找回密码
 立即注册
搜索
  • 【快讯】Qwen3-Next-80B-A3B 发布

    Qwen3-Next 是一种采用稀疏 MoE、线性注意力和多 token 预测的下一代架构,具备旗舰级的指令遵循和推理能力,在超长上下文理解与复杂任务处理方面表现出色。 其原生支持高达 262,144 个 token 的上下文长度。Qwen Bl ...

    omygod2025-9-12