嘿,大家!可能你们还不知道,通义千问发布了Qwen3Coder,这是一款在编码和智能体任务方面能与GPT4.1以及Claude 4Sonnet相媲美的前沿模型。我们把这个拥有4800亿参数的模型体积缩小到了仅150GB(原来是512GB)。而且,它能在100万个上下文长度下运行。如果你想以全精度运行该模型,可以使用我们的Q8量化方案。在150GB统一内存,或者135GB随机存取存储器(RAM)加上16GB显存(VRAM)的配置下,每秒能处理超过6个令牌。运行Qwen3Coder的GGUF文件链接:https://huggingface.co/unsloth/Qwen3Coder480BA35BInstructGGUF祝大家运行顺利!别忘了查看我们关于Qwen3Coder的教程,里面介绍了如何通过优化设置和配置来实现快速推理:https://docs.unsloth.ai/basics/qwen3coder  |