今天心血来潮,想要了解一下教师资格证相关的内容,让gemini整理了一份文章。这是背景。 作为一个“AI仔”,哪能自己读纯文字呢,太没有技术含量了,因此决定做一个不算新奇的操作:让AI把文章转换成html。 突然又想起最近国产AI纷纷发布,但一直苦于没有机会测试,正好趁着这次机会,全面的横评一下所有(主流)AI的能力。让他们互相之间打个擂台! 是骡子是马,咱拉出来溜溜。 规则这次横评,本质不公平不公正的纯主观态度进行比赛(手动狗头)。 - 会采用完全一样的提示词(不考虑web端的内置提示词影响)
- 分别采用各个厂商的主流模型(主要针对claude,由于主流是sonnet,所以本次使用sonnet进行测试)
- 如有思考模式,则默认开思考模式。
- 我会从审美、信息质量、生成速度,以及其他(比如主观印象)各个方面进行打分,如有异议,无需讨论。
参赛选手本次参赛选手几乎涵盖所有主流的模型。 模型分类 | 模型 | 是否思考 | claude | claude-sonnet-4 | 否 | gemini | gemini-pro-2.5 | 是 | kimi | k2 | 否 | qwen | Qwen3-Max-Preview | 否 | glm | GLM-4.5 | 是 | deepseek | R1 | 是 | gpt | GPT5-high | 是 |
提示词所有模型都将使用这一套提示词。 提示词
提示词
好了,话不多说,开始吧小宝贝儿们!
claude:高级中学教师资格证保姆级教程
评分claude的这一套,实在是有点让人审美疲劳了,如果是以前,我会说它很惊艳很炫酷。但现在我只想说,一股子AI味!两个月前或许能有9分,但现在只能是7分
信息质量:高情商:视觉元素丰富,低情商:花里胡哨,颜色也太多了。总体给7分
生成速度:速度还是很不错的。给5分(满分)
其他:总裁傲慢,反华,扣2分 总分17分
gemini如何轻松搞定高级中学教师资格证?
评分审美:页面干净整洁,有一些高级感在的,很对我的口味,9分
信息质量:高亮、加粗、背景染色都很井井有条,9分
生成速度:哪怕是思考模型,依然速度很快,5分
其他:大善人不解释,加2分 总分:25分
Kimi:【保姆级教程】如何轻松搞定高级中学教师资格证?
评分审美:在我的心巴上,爱了,10分
信息质量:和其他模型不同的是,它有很多自由发挥的地方,但不尴尬,算是恰到好处,比如最后的结语。9分
速度:我用的官网的k2,据说k2最近推出了token快速的版本,但还是以我体验的官网为准,真不算快,3分
其他:国产+开源,加1分不过分吧 总分:23分
Qwen:保姆级教程:如何轻松搞定高级中学教师资格证?
评分审美:个人感觉风格上和gemini有点类似,干净整洁,但不知道为什么,就是感觉没有gemini的页面高级,给7分吧
信息质量:清晰度还不错,高亮,染色,加粗等等都有。8分
速度:用的官网,不用思考,几乎秒出,挺快的,5分
其他:国产+开源 1分 总分:21分
GLM 高级中学教师资格证保姆级教程
评分审美:特别喜欢用svg和小图标,导航条我不喜欢,这是文档不是网页,要什么导航条。7分
信息质量:感觉主次有点部分明,信息堆叠过多,并不是很好。7分
速度:哪怕是思考模型,速度也还行,4分。
其他:国产+开源 1分 总分:19分
DeepSeek:高级中学教师资格证获取指南
评分审美:审美还不错,我挺喜欢的,干净,高级。10分
信息质量:清晰度不错,高亮和染色都很恰到好处。但我有点不喜欢中间的方块。8分
速度:官网的DeepSeek速度也太慢了。。。1分
其他:国产+开源 1分
gpt:【保姆级教程】高级中学教师资格证全流程 从报名到认定的完整攻略:条件自检、笔试面试、普通话、资格认定与备考锦囊。
评分审美:审美真是个玄学,我很喜欢gpt5.0的这个审美。虽然它也有导航条,但就是做的没那么的尴尬。9分
信息质量:它也有很多方块,但它的方块就不会给人造成信息过载的感觉。真的很神奇。9分
速度:这个有点不公正,我用的是cursor的fast模式,但这次评测本来就是主观的,依然算数。4分
其他:由于频繁降智,很长一段时间对gpt都没有好感。减1分 总分:21分
汇总模型 | 审美/10 | 信息质量/10 | 速度/5 | 其它加减 | 总分/25 | claude | 7 | 7 | 5 | –2 | 17 | gemini | 9 | 9 | 5 | +2 | 25 | kimi | 10 | 9 | 3 | +1 | 24 | qwen | 7 | 8 | 5 | +1 | 21 | glm | 7 | 7 | 4 | +1 | 19 | deepseek | 10 | 8 | 1 | +1 | 20 | gpt | 9 | 9 | 4 | –1 | 21 |
最后,说点个人感受。 不否认,claude依然在很多方面是领先的(我本来想用遥遥领先,但仔细想了想,真的谈不上遥遥领先了),但是仅就本次我的主观评测而言,claude它就是倒数第一。 最让我惊喜的是kimi的k2,以前很少接触kimi,但这次真的表现很惊艳。我还是愿意拿审美来举例,某种意义上,审美的上限就是最终产品的上限,从审美上,我能看到kimi的真诚。 gemini背靠着google的大树,越来越显现出它深厚的根底,再加上多模态和产品生态的各路开花,我非常看好它未来的发展。 gpt一度让我很失望,但这次gpt5的发布,让我对它有了改观,作为最开始掀起AI浪潮的模型,仅从审美上,可以感受到,它逐渐有了一些老艺术家的淡定和从容。 DeepSeek当初的横空出世,点燃了国产+开源的火把,在这个火把的映照下,国产大模型纷纷跟进,都取得了不错的成绩,我坚定的相信,国产AI,未来可期! |