发帖
 找回密码
 立即注册
搜索
0 0 0
前沿情报 352 0 7 小时前
今天心血来潮,想要了解一下教师资格证相关的内容,让gemini整理了一份文章。这是背景。
作为一个“AI仔”,哪能自己读纯文字呢,太没有技术含量了,因此决定做一个不算新奇的操作:让AI把文章转换成html。
突然又想起最近国产AI纷纷发布,但一直苦于没有机会测试,正好趁着这次机会,全面的横评一下所有(主流)AI的能力。让他们互相之间打个擂台!
是骡子是马,咱拉出来溜溜。
规则
这次横评,本质不公平不公正的纯主观态度进行比赛(手动狗头)。
  • 会采用完全一样的提示词(不考虑web端的内置提示词影响)
  • 分别采用各个厂商的主流模型(主要针对claude,由于主流是sonnet,所以本次使用sonnet进行测试)
  • 如有思考模式,则默认开思考模式。
  • 我会从审美、信息质量、生成速度,以及其他(比如主观印象)各个方面进行打分,如有异议,无需讨论。
参赛选手
本次参赛选手几乎涵盖所有主流的模型。
模型分类模型是否思考
claudeclaude-sonnet-4
geminigemini-pro-2.5
kimik2
qwenQwen3-Max-Preview
glmGLM-4.5
deepseekR1
gptGPT5-high

提示词
所有模型都将使用这一套提示词。
提示词
提示词
好了,话不多说,开始吧小宝贝儿们!

claude:高级中学教师资格证保姆级教程   
评分
claude的这一套,实在是有点让人审美疲劳了,如果是以前,我会说它很惊艳很炫酷。但现在我只想说,一股子AI味!两个月前或许能有9分,但现在只能是7分
信息质量:高情商:视觉元素丰富,低情商:花里胡哨,颜色也太多了。总体给7分
生成速度:速度还是很不错的。给5分(满分)
其他:总裁傲慢,反华,扣2分
总分17分

gemini如何轻松搞定高级中学教师资格证?   
评分
审美:页面干净整洁,有一些高级感在的,很对我的口味,9分
信息质量:高亮、加粗、背景染色都很井井有条,9分
生成速度:哪怕是思考模型,依然速度很快,5分
其他:大善人不解释,加2分
总分:25分

Kimi:【保姆级教程】如何轻松搞定高级中学教师资格证?   
评分
审美:在我的心巴上,爱了,10分
信息质量:和其他模型不同的是,它有很多自由发挥的地方,但不尴尬,算是恰到好处,比如最后的结语。9分
速度:我用的官网的k2,据说k2最近推出了token快速的版本,但还是以我体验的官网为准,真不算快,3分
其他:国产+开源,加1分不过分吧
总分:23分

Qwen:保姆级教程:如何轻松搞定高级中学教师资格证?   
评分
审美:个人感觉风格上和gemini有点类似,干净整洁,但不知道为什么,就是感觉没有gemini的页面高级,给7分吧
信息质量:清晰度还不错,高亮,染色,加粗等等都有。8分
速度:用的官网,不用思考,几乎秒出,挺快的,5分
其他:国产+开源 1分
总分:21分

GLM    高级中学教师资格证保姆级教程   
评分
审美:特别喜欢用svg和小图标,导航条我不喜欢,这是文档不是网页,要什么导航条。7分
信息质量:感觉主次有点部分明,信息堆叠过多,并不是很好。7分
速度:哪怕是思考模型,速度也还行,4分。
其他:国产+开源 1分
总分:19分

DeepSeek:高级中学教师资格证获取指南   
评分
审美:审美还不错,我挺喜欢的,干净,高级。10分
信息质量:清晰度不错,高亮和染色都很恰到好处。但我有点不喜欢中间的方块。8分
速度:官网的DeepSeek速度也太慢了。。。1分
其他:国产+开源 1分

gpt【保姆级教程】高级中学教师资格证全流程  从报名到认定的完整攻略:条件自检、笔试面试、普通话、资格认定与备考锦囊。
评分
审美:审美真是个玄学,我很喜欢gpt5.0的这个审美。虽然它也有导航条,但就是做的没那么的尴尬。9分
信息质量:它也有很多方块,但它的方块就不会给人造成信息过载的感觉。真的很神奇。9分
速度:这个有点不公正,我用的是cursor的fast模式,但这次评测本来就是主观的,依然算数。4分
其他:由于频繁降智,很长一段时间对gpt都没有好感。减1分
总分:21分

汇总
模型审美/10信息质量/10速度/5其它加减总分/25
claude775–217
gemini995+225
kimi1093+124
qwen785+121
glm774+119
deepseek1081+120
gpt994–121

最后,说点个人感受。
不否认,claude依然在很多方面是领先的(我本来想用遥遥领先,但仔细想了想,真的谈不上遥遥领先了),但是仅就本次我的主观评测而言,claude它就是倒数第一。
最让我惊喜的是kimi的k2,以前很少接触kimi,但这次真的表现很惊艳。我还是愿意拿审美来举例,某种意义上,审美的上限就是最终产品的上限,从审美上,我能看到kimi的真诚。
gemini背靠着google的大树,越来越显现出它深厚的根底,再加上多模态和产品生态的各路开花,我非常看好它未来的发展。
gpt一度让我很失望,但这次gpt5的发布,让我对它有了改观,作为最开始掀起AI浪潮的模型,仅从审美上,可以感受到,它逐渐有了一些老艺术家的淡定和从容。
DeepSeek当初的横空出世,点燃了国产+开源的火把,在这个火把的映照下,国产大模型纷纷跟进,都取得了不错的成绩,我坚定的相信,国产AI,未来可期!
──── 0人觉得很赞 ────

使用道具 举报

写HTML也就只能展现模型的前端审美而已,要是真的要做编码性能对比,后端水平才是关键
哈哈,所以说这是我主观的评测,审美占了很大比例。
我也是,这个看上去最规整
我建议使用腾讯云进行托管。
Claude就像是这两年特别流行的那种开源小网站。Gemini是我个人最喜欢的。Kimi的本地化审美倾向最为明显。Qwen的设计感相比Gemini感觉要落后一代。GLM有点杂乱。DeepSeek和Gemini相差不算大,不过它大块高亮的处理感觉有些随意。GPT的界面跟现在主流的国外课程网页几乎没什么差别 。  
好家伙!太强了
您需要登录后才可以回帖 立即登录
高级模式