事情起因是最近各地足球赛事跟足协的事情闹得沸沸扬扬,抖音刷到的片段信息又自我矛盾,就去最近常用的Gemini问了下看具体是什么情况,结果Gemini的回答差强人意,就去试了几个常用的大模型,差别挺大。各个大模型现在都说自己多厉害,都很高大上,但是普通用户的实际使用情况来看,可能用一两次不符合预期就不会再用了。感觉挺有意思的,各个模型的回答贴出来跟大家分享。
Gemini(答非所问,没有理解到“最近”这个关键字眼)

Claude(相比gemini更好)

deep seek(也还可以)

通义千问

密塔(比较准确)

kimi(也是差强人意)

chatgpt(免费版,也是差强人意)

豆包(最符合我的需求)
