分享一下不同大语言模型自己的使用体验

日常闲聊 · 2025-8-21 13:45:18

先后尝试了近十个模型，分别有商用的，和开源自己搭建的（5090）简易版，分享一下自己的使用体验咯
一共有如下模型：GPT5（会员），claude4.1 opus（会员），deepseek（官网免费），deepseek（abliterated），grok4（会员），QWEN3（abliterated），gemini2.5pro（白嫖）
综合感觉最强的模型：claude4.1 opus，无论是编程，还是小说创作，都感觉一次成功率很高，不需要反复的去调整，修改。比较省心的一个模型
其次是 GPT5，逻辑感觉很强，但是总觉得那里不对劲。当反复调整 prompt 之后，回答的质量又感觉远超其他人。其中有一点引起我的注意，不知道是不是错觉，GPT5 喜欢偷懒，回答比其他的模型要短。
deepseek（官网免费），deepseek（abliterated），这俩一起说，感觉无论是编程，还是小说创作，都被 claude 吊打，但是谁让他是免费的呢。而且，还有人分享了他的破限版本，我使用感觉是，hhh，仍然有一些话题，模型会拒绝回答。但是好歹也是平均水平线的模型，还可以吧
grok4（会员），是最让我失望的模型，会员开了感觉是最不值的，感觉全在吹牛，我甚至有种错觉，grok4 比 grok3 的限制更多，比如说以前愿意回答的问题，现在直接拒绝回答。
智力和其他家收费的拉不开差距，限制还变高了，我要你何用？而且回答重复概率仍然很高
QWEN3（abliterated），感觉和 deepseek 的体验一模一样，他俩最大的缺点是，token 似乎最大只能 8192…
gemini2.5pro（白嫖），编程水平感觉一般，不如 gpt 或者克劳德，但是他写小说的水平还不错
最后个人使用体验排名：
小说创作：Claude=gemini》gpt》grok》qwen3》deepseek》grok
编程：claude》gpt》gemini》grok》QWEN》deepseek

将进酒 · 2025-8-21 13:47:27

国内的模型，除了通义千问（Qwen），我几乎都没用过。

Adamspz · 2025-8-21 14:14:28

老充这么多会员，有实力

孤独ping · 2025-8-21 16:31:00

grok确实太垃圾了，付费的完全被其他家比下去了。甚至还不如好多免费的

小草与叶子 · 2025-8-23 15:43:27

没有，得自己搭建，都是一些本地的开源模型。

walter · 2025-8-24 19:21:51

我先后试过将近十个模型，有商用的，也有开源后自己搭建的（5090）简易版。下面分享一下我的使用体验。

这些模型分别是：
GPT5（会员版）、claude4.1 opus（会员版）、deepseek（官网免费版）、deepseek（破解版）、grok4（会员版）、QWEN3（破解版）、gemini2.5pro（免费体验版）。

综合来看最强的模型是claude4.1 opus。不管是编程还是小说创作，一次成功率都挺高，不需要反复调整修改，比较省心。

其次是GPT5，逻辑很强，但总感觉有点问题。反复调整提示词（prompt）后，回答质量远超其他模型。有一点引起了我的注意，不知道是不是错觉，GPT5好像喜欢偷懒，回答比其他模型要简短。

deepseek（官网免费版）和deepseek（破解版）一起说。在编程和小说创作方面，感觉被claude全方位碾压。不过它是免费的。而且有人分享了破解限制的版本，我用的时候发现，还是有一些话题模型会拒绝回答。但好歹算是达到平均水平的模型，还凑合吧。

grok4（会员版）是最让我失望的模型，开了会员感觉特别不值，感觉全是在吹嘘。我甚至有种错觉，grok4比grok3的限制还多，以前能回答的问题，现在直接拒绝回答。和其他收费模型相比，能力没什么优势，限制还变多了，要它有什么用？而且回答的重复概率仍然很高。

QWEN3（破解版），使用体验和deepseek差不多，这俩最大的缺点是，令牌数（token）似乎最大只能到8192……

gemini2.5pro（免费体验版），编程水平一般，不如GPT或者克劳德，但写小说的水平还不错。

最后说说我个人的使用体验排名：
小说创作：Claude = gemini ＞ gpt ＞ grok ＞ qwen3 ＞ deepseek ＞ grok
编程：claude ＞ gpt ＞ gemini ＞ grok ＞ QWEN ＞ deepseek

你们的使用体验怎么样，也分享分享吧

mjp004 · 2025-8-25 02:07:41

涩涩一辈子就只跟哈吉米玩

真没意思，想找人聊天的话，一般我都找GPT

不管想到啥话题，都会去找Gemini

要是有需要快速回答或者比较简单的问题，就找豆包

碰到任何学科类问题，一般也找豆包（特别是数学、语文，千万别找生物）。化学问题的话，你可以放心交给哈基米和GPT，不过GPT免费用户上传图片的额度太少了，得先用豆包或者GLM4.5v转换成文本才行

要是玩角色扮演，优先考虑DS；要是想发布内容，优先选豆包，其次是智谱清言

说到编程，免费用户用GPT太拉垮了
付费的话勉强能用，最好用来改代码错误，而不是写代码。它是目前所有AI里能把前端写得最漂亮的一个，但是能不能用，这可不好说
主要的代码需求由哈基米来搞定，改代码可能会用到K2

补充一下上面提到的内容，突然想起来GLM4.5v在上次简单测试中给我的震撼特别大，强烈推荐用它来做一些识图类的工作，比如试试OCR



2个回复



heart



open_mouth



7

xudongxi · 2025-8-25 08:41:35

编程：
claude 优于 gpt 优于 gemini 优于 grok 优于 QWEN 优于 deepseek

sfers · 2025-8-27 20:32:44

老友这个帖子跟我的体验简直一模一样了，终于找到有同样体验的人了。之前我这么说，身边都没人搭理我，天天有人拿豆包、kimi来作比较。

		自动登录	找回密码
密码			立即注册

交流分享一下不同大语言模型自己的使用体验

8 回复

浏览过的版块