赛博八角笼！一次真实主观的AI用例横评

前沿情报 · 7 小时前

今天心血来潮，想要了解一下教师资格证相关的内容，让gemini整理了一份文章。这是背景。

作为一个“AI仔”，哪能自己读纯文字呢，太没有技术含量了，因此决定做一个不算新奇的操作：让AI把文章转换成html。

突然又想起最近国产AI纷纷发布，但一直苦于没有机会测试，正好趁着这次机会，全面的横评一下所有（主流）AI的能力。让他们互相之间打个擂台！

是骡子是马，咱拉出来溜溜。

规则

这次横评，本质不公平不公正的纯主观态度进行比赛（手动狗头）。

会采用完全一样的提示词（不考虑web端的内置提示词影响）
分别采用各个厂商的主流模型（主要针对claude，由于主流是sonnet，所以本次使用sonnet进行测试）
如有思考模式，则默认开思考模式。
我会从审美、信息质量、生成速度，以及其他（比如主观印象）各个方面进行打分，如有异议，无需讨论。

参赛选手

本次参赛选手几乎涵盖所有主流的模型。

模型分类	模型	是否思考
claude	claude-sonnet-4	否
gemini	gemini-pro-2.5	是
kimi	k2	否
qwen	Qwen3-Max-Preview	否
glm	GLM-4.5	是
deepseek	R1	是
gpt	GPT5-high	是

提示词

所有模型都将使用这一套提示词。

提示词
提示词

好了，话不多说，开始吧小宝贝儿们！

claude：高级中学教师资格证保姆级教程
评分

claude的这一套，实在是有点让人审美疲劳了，如果是以前，我会说它很惊艳很炫酷。但现在我只想说，一股子AI味！两个月前或许能有9分，但现在只能是7分
信息质量：高情商：视觉元素丰富，低情商：花里胡哨，颜色也太多了。总体给7分
生成速度：速度还是很不错的。给5分（满分）
其他：总裁傲慢，反华，扣2分

总分17分

gemini如何轻松搞定高级中学教师资格证？
评分

审美：页面干净整洁，有一些高级感在的，很对我的口味，9分
信息质量：高亮、加粗、背景染色都很井井有条，9分
生成速度：哪怕是思考模型，依然速度很快，5分
其他：大善人不解释，加2分

总分：25分

Kimi：【保姆级教程】如何轻松搞定高级中学教师资格证？
评分

审美：在我的心巴上，爱了，10分
信息质量：和其他模型不同的是，它有很多自由发挥的地方，但不尴尬，算是恰到好处，比如最后的结语。9分
速度：我用的官网的k2，据说k2最近推出了token快速的版本，但还是以我体验的官网为准，真不算快，3分
其他：国产+开源，加1分不过分吧

总分：23分

Qwen：保姆级教程：如何轻松搞定高级中学教师资格证？
评分

审美：个人感觉风格上和gemini有点类似，干净整洁，但不知道为什么，就是感觉没有gemini的页面高级，给7分吧
信息质量：清晰度还不错，高亮，染色，加粗等等都有。8分
速度：用的官网，不用思考，几乎秒出，挺快的，5分
其他：国产+开源 1分

总分：21分

GLM 高级中学教师资格证保姆级教程
评分

审美：特别喜欢用svg和小图标，导航条我不喜欢，这是文档不是网页，要什么导航条。7分
信息质量：感觉主次有点部分明，信息堆叠过多，并不是很好。7分
速度：哪怕是思考模型，速度也还行，4分。
其他：国产+开源 1分

总分：19分

DeepSeek：高级中学教师资格证获取指南
评分

审美：审美还不错，我挺喜欢的，干净，高级。10分
信息质量：清晰度不错，高亮和染色都很恰到好处。但我有点不喜欢中间的方块。8分
速度：官网的DeepSeek速度也太慢了。。。1分
其他：国产+开源 1分

gpt：【保姆级教程】高级中学教师资格证全流程 从报名到认定的完整攻略：条件自检、笔试面试、普通话、资格认定与备考锦囊。
评分

审美：审美真是个玄学，我很喜欢gpt5.0的这个审美。虽然它也有导航条，但就是做的没那么的尴尬。9分
信息质量：它也有很多方块，但它的方块就不会给人造成信息过载的感觉。真的很神奇。9分
速度：这个有点不公正，我用的是cursor的fast模式，但这次评测本来就是主观的，依然算数。4分
其他：由于频繁降智，很长一段时间对gpt都没有好感。减1分

总分：21分

汇总

模型	审美/10	信息质量/10	速度/5	其它加减	总分/25
claude	7	7	5	–2	17
gemini	9	9	5	+2	25
kimi	10	9	3	+1	24
qwen	7	8	5	+1	21
glm	7	7	4	+1	19
deepseek	10	8	1	+1	20
gpt	9	9	4	–1	21

最后，说点个人感受。

不否认，claude依然在很多方面是领先的（我本来想用遥遥领先，但仔细想了想，真的谈不上遥遥领先了），但是仅就本次我的主观评测而言，claude它就是倒数第一。

最让我惊喜的是kimi的k2，以前很少接触kimi，但这次真的表现很惊艳。我还是愿意拿审美来举例，某种意义上，审美的上限就是最终产品的上限，从审美上，我能看到kimi的真诚。

gemini背靠着google的大树，越来越显现出它深厚的根底，再加上多模态和产品生态的各路开花，我非常看好它未来的发展。

gpt一度让我很失望，但这次gpt5的发布，让我对它有了改观，作为最开始掀起AI浪潮的模型，仅从审美上，可以感受到，它逐渐有了一些老艺术家的淡定和从容。

DeepSeek当初的横空出世，点燃了国产+开源的火把，在这个火把的映照下，国产大模型纷纷跟进，都取得了不错的成绩，我坚定的相信，国产AI，未来可期！

兰色的风 · 6 小时前

写HTML也就只能展现模型的前端审美而已，要是真的要做编码性能对比，后端水平才是关键

ibo4198 · 5 小时前

哈哈，所以说这是我主观的评测，审美占了很大比例。

dddddno1 · 5 小时前

我也是，这个看上去最规整

AngelKiss · 5 小时前

我建议使用腾讯云进行托管。

灰山子 · 5 小时前

Claude就像是这两年特别流行的那种开源小网站。Gemini是我个人最喜欢的。Kimi的本地化审美倾向最为明显。Qwen的设计感相比Gemini感觉要落后一代。GLM有点杂乱。DeepSeek和Gemini相差不算大，不过它大块高亮的处理感觉有些随意。GPT的界面跟现在主流的国外课程网页几乎没什么差别。

hhhh713 · 2 小时前

好家伙！太强了

		自动登录	找回密码
密码			立即注册

评测赛博八角笼！一次真实主观的AI用例横评

相关帖子