grok 4真的惜字如金啊,思考了8分钟,结果回答了一个字
<blockquote><p>问题:一个圆台形的木块,上、下底面的半径分别为4和8,高为3,用它加工成一个与圆台等高的四棱台,棱台下底面为一边长等于9的矩形,且使其体积最大。现再从余下的四块木料中选择一块车削加工成一个球,则所得球的半径最大值是?(加工过程中不计损耗)</p>
</blockquote>
<p><img src="data/attachment/forum/202507/15/150434croltosgrts54l0c.webp" alt="41df8e5141295f8d8c13ac244074d4eb3bfd2a9c.webp" title="41df8e5141295f8d8c13ac244074d4eb3bfd2a9c.webp" /></p>
看标题我以为是: 滚
原来是正常回应 不写额外提示词的时候我也遇到过,就一个最终答案,虽然确实是对的 绝不多说一个字 FineRIk 发表于 2025-7-15 15:05
不写额外提示词的时候我也遇到过,就一个最终答案,虽然确实是对的
是有默认提示词的,但它好像直接忽略了 <p>grok官网测试结果如上<br />
推测可能受system提示词影响</p>
<p><img src="data/attachment/forum/202507/15/150548u6u3qaggggnlui07.webp" alt="571b87bc0f770bbc30c645d297518cbab5135c55.webp" title="571b87bc0f770bbc30c645d297518cbab5135c55.webp" /></p>
我也发现了,不管思考多久,他回答的一般是“你的问题”。
比起现在开局先夸你问题问的好,然后一通延伸,一堆注,括号解释的AI,这种“没有废话的高手”,或许才是正确的方向。 <p>思考5分钟</p>
<p><img src="data/attachment/forum/202507/15/150628ikgi7a6g6tjsxoad.png" alt="图片.png" title="图片.png" /></p>
哈哈哈,你就说是不是1 下次试试问它‘为什么思考了八分钟才给我一个字’。看看它怎么编 很好,人狠话不多。 没啥意义,无非就是format和默认tone的区别……你完全可以要求模型最终只输出答案,或者用structural output把答案放在某个项下面。这里并不是“惜字如金”,而是RL的时候懒得把中间过程输出来,而是统统藏在CoT里头。你的想法可能是对于非思考模型的(
实际上这可能是因为grok和o3类似的逻辑,也就是有的时候先枚举一个答案出来再拟合中间过程。
反过来讲,如果你问的问题比较模糊,例如里面实际上涉及多种情况或者说多个问题,然后他只给了一个回答,和你原来想问的不一样,那不是很容易误导人? 目前第一梯队还是 O3 GEMINI 2.5 PRO 以及cloud 4 grok4 回答也太简短了些 算后才知球半径
页:
[1]