Grok 4 完整的测试下来倒也没有那么不堪,逻辑、数学、知识上还是很强悍的,但是审美、文笔、前端编程上不行
和简中测下来的一片唱衰不同,外网目前还是挺情绪高涨的,不知道是不是语言带来的回答差异
总之,Grok 4 没有那么差
但我想我不会用它
原因也很简单:Grok 4 没有创造一个让我用它的需求,也没有强到改变我的习惯
日常对话和最广泛的任务,我选择 Gemini 2.5 Pro,哈基米幻觉不算高,知识广度深度足够,最重要的是它爱说话,会说话,通人性,与 AI 们对话我能明显感觉到 Gemini 是语气最好的,也是说的最清楚的
Grok 4 给我感觉就是一个纯社恐理科生,能不说话就不说话,惜字如金,中文也不太好,OUT!
信息检索和深度思考我用 ChatGPT App 上的 o3 和 o3-pro,信息检索断层第一,思维足够强悍,可调用的工具也够多,Python能解决相当多的问题
Grok 4 完全打不过,OUT!
编程我用 Claude,没话讲,Augment 的 Claude 就是无敌
Grok 4 前端编程看起来还有倒退,OUT!
所以说,现在三大家 AI 在我这里已经各司其职了,Grok 作为外来者必须要在某一方面足够强大才能代替其中一个,或者它能够创造出一个全新的需求也可以
但显然,Grok 4 失败了
它是一个比较六边形的战士,它够强,可惜没有在任何一个方面做到“绝对的强”
至少就目前为止,我还是喜欢跟双子座侃侃而谈,与 o3 一起做 Fact-Check,和克劳德先生一起编写代码,反正,我是不会想起打开手机上不知道放在屏幕第几页的 Grok