本来我知道Qwen3不行,性能很差劲,无论是推理、代码、知识;
但是今天真的刷新我的认知了,今天写公文,本来感觉Qwen3毕竟是国内的模型,这方面肯定更加擅长,结果用了后,发现Qwen写的就是一坨大的,写公文的都快写成小说了,也不理解prompt的意思,和Deepseek R1差的远了,当然,更是与Gemini 2.5 pro比的资格都没有。
总体使用下来,写公文gemini 2.5 pro最强,Deepseek R1够用。
以上均是个人日常使用亲身体验,纯个人主观感受。
阿里AI是不行了,以后国内基本先进模型看DS,大模型企业部署与应用看字节了。
另外,补充一下,我分享这个的目的是为了帮助佬友们避坑差劲的大模型,我用自己的时间与精力去体验验证了Qwen不行,避免佬友们在Qwen上浪费时间与精力,用更好的模型快速实现自己的需求,总的推荐还是:
编程无脑选择claude,知识写作gemini最强,工具调用o3比较好;
如果用不了国外御三家,国内首推Deepseek R1与V3,综合性能甩开了国内各个模型,或者可以试试豆包(一些本土特色任务不错);
现在大模型太多了,使用一些性能差的模型何尝不是一种工作效率的降低。
Qwen3给人的感受就是Qwen会成为下一个百度文心、GLM的样子,没有更先进的模型来支撑,后期发展乏力,之后转变赛道,不再追求模型先进性,找一些差异化的别的AI大厂不太关注的赛道来做。
对了,我有点印象,好像是Qwen2.5的技术负责人被字节挖走了,Qwen2.5与3主导开发的应该不是一拨人。
字节跳动,传8位数年薪,挖走阿里巴巴大模型核心人物