发帖
 找回密码
 立即注册
搜索
0 0 0
日常闲聊 661 0 2025-8-21 13:45:18

先后尝试了近十个模型,分别有商用的,和开源自己搭建的(5090)简易版,分享一下自己的使用体验咯
一共有如下模型:GPT5(会员),claude4.1 opus(会员),deepseek(官网免费),deepseek(abliterated),grok4(会员),QWEN3(abliterated),gemini2.5pro(白嫖)
综合感觉最强的模型:claude4.1 opus,无论是编程,还是小说创作,都感觉一次成功率很高,不需要反复的去调整,修改。比较省心的一个模型
其次是 GPT5,逻辑感觉很强,但是总觉得那里不对劲。当反复调整 prompt 之后,回答的质量又感觉远超其他人。其中有一点引起我的注意,不知道是不是错觉,GPT5 喜欢偷懒,回答比其他的模型要短。
deepseek(官网免费),deepseek(abliterated),这俩一起说,感觉无论是编程,还是小说创作,都被 claude 吊打,但是谁让他是免费的呢。而且,还有人分享了他的破限版本,我使用感觉是,hhh,仍然有一些话题,模型会拒绝回答。但是好歹也是平均水平线的模型,还可以吧
grok4(会员),是最让我失望的模型,会员开了感觉是最不值的,感觉全在吹牛,我甚至有种错觉,grok4 比 grok3 的限制更多,比如说以前愿意回答的问题,现在直接拒绝回答。
智力和其他家收费的拉不开差距,限制还变高了,我要你何用?而且回答重复概率仍然很高
QWEN3(abliterated),感觉和 deepseek 的体验一模一样,他俩最大的缺点是,token 似乎最大只能 8192…
gemini2.5pro(白嫖),编程水平感觉一般,不如 gpt 或者克劳德,但是他写小说的水平还不错
最后个人使用体验排名:
小说创作:Claude=gemini》gpt》grok》qwen3》deepseek》grok
编程:claude》gpt》gemini》grok》QWEN》deepseek

──── 0人觉得很赞 ────

使用道具 举报

2025-8-21 13:47:27
国内的模型,除了通义千问(Qwen),我几乎都没用过。  
2025-8-21 14:14:28
老充这么多会员,有实力
2025-8-21 16:31:00
grok确实太垃圾了,付费的完全被其他家比下去了。甚至还不如好多免费的
没有,得自己搭建,都是一些本地的开源模型。
2025-8-24 19:21:51
我先后试过将近十个模型,有商用的,也有开源后自己搭建的(5090)简易版。下面分享一下我的使用体验。

这些模型分别是:
GPT5(会员版)、claude4.1 opus(会员版)、deepseek(官网免费版)、deepseek(破解版)、grok4(会员版)、QWEN3(破解版)、gemini2.5pro(免费体验版) 。

综合来看最强的模型是claude4.1 opus。不管是编程还是小说创作,一次成功率都挺高,不需要反复调整修改,比较省心。

其次是GPT5,逻辑很强,但总感觉有点问题。反复调整提示词(prompt)后,回答质量远超其他模型。有一点引起了我的注意,不知道是不是错觉,GPT5好像喜欢偷懒,回答比其他模型要简短。

deepseek(官网免费版)和deepseek(破解版)一起说。在编程和小说创作方面,感觉被claude全方位碾压。不过它是免费的。而且有人分享了破解限制的版本,我用的时候发现,还是有一些话题模型会拒绝回答。但好歹算是达到平均水平的模型,还凑合吧。

grok4(会员版)是最让我失望的模型,开了会员感觉特别不值,感觉全是在吹嘘。我甚至有种错觉,grok4比grok3的限制还多,以前能回答的问题,现在直接拒绝回答。和其他收费模型相比,能力没什么优势,限制还变多了,要它有什么用?而且回答的重复概率仍然很高。

QWEN3(破解版),使用体验和deepseek差不多,这俩最大的缺点是,令牌数(token)似乎最大只能到8192……

gemini2.5pro(免费体验版),编程水平一般,不如GPT或者克劳德,但写小说的水平还不错。

最后说说我个人的使用体验排名:
小说创作:Claude = gemini > gpt > grok > qwen3 > deepseek > grok
编程:claude > gpt > gemini > grok > QWEN > deepseek

你们的使用体验怎么样,也分享分享吧
2025-8-25 02:07:41
涩涩一辈子就只跟哈吉米玩

真没意思,想找人聊天的话,一般我都找GPT

不管想到啥话题,都会去找Gemini

要是有需要快速回答或者比较简单的问题,就找豆包

碰到任何学科类问题,一般也找豆包(特别是数学、语文,千万别找生物)。化学问题的话,你可以放心交给哈基米和GPT,不过GPT免费用户上传图片的额度太少了,得先用豆包或者GLM4.5v转换成文本才行

要是玩角色扮演,优先考虑DS;要是想发布内容,优先选豆包,其次是智谱清言

说到编程,免费用户用GPT太拉垮了
付费的话勉强能用,最好用来改代码错误,而不是写代码。它是目前所有AI里能把前端写得最漂亮的一个,但是能不能用,这可不好说
主要的代码需求由哈基米来搞定,改代码可能会用到K2

补充一下上面提到的内容,突然想起来GLM4.5v在上次简单测试中给我的震撼特别大,强烈推荐用它来做一些识图类的工作,比如试试OCR  


  

2个回复  


  

heart  


  

open_mouth  


  

7  
2025-8-25 08:41:35
编程:
claude 优于 gpt 优于 gemini 优于 grok 优于 QWEN 优于 deepseek
2025-8-27 20:32:44
老友这个帖子跟我的体验简直一模一样了,终于找到有同样体验的人了。之前我这么说,身边都没人搭理我,天天有人拿豆包、kimi来作比较 。
您需要登录后才可以回帖 立即登录
高级模式