hslxwu 发表于 2025-7-15 15:04:36

grok 4真的惜字如金啊,思考了8分钟,结果回答了一个字

<blockquote>
<p>问题:一个圆台形的木块,上、下底面的半径分别为4和8,高为3,用它加工成一个与圆台等高的四棱台,棱台下底面为一边长等于9的矩形,且使其体积最大。现再从余下的四块木料中选择一块车削加工成一个球,则所得球的半径最大值是?(加工过程中不计损耗)</p>
</blockquote>
<p><img src="data/attachment/forum/202507/15/150434croltosgrts54l0c.webp" alt="41df8e5141295f8d8c13ac244074d4eb3bfd2a9c.webp" title="41df8e5141295f8d8c13ac244074d4eb3bfd2a9c.webp" /></p>

侧面 发表于 2025-7-15 15:04:53

看标题我以为是: 滚
原来是正常回应

FineRIk 发表于 2025-7-15 15:05:00

不写额外提示词的时候我也遇到过,就一个最终答案,虽然确实是对的

x_uy_u_n 发表于 2025-7-15 15:05:15

绝不多说一个字

hslxwu 发表于 2025-7-15 15:05:30

FineRIk 发表于 2025-7-15 15:05
不写额外提示词的时候我也遇到过,就一个最终答案,虽然确实是对的

是有默认提示词的,但它好像直接忽略了

猎人阿祥 发表于 2025-7-15 15:05:49

<p>grok官网测试结果如上<br />
推测可能受system提示词影响</p>
<p><img src="data/attachment/forum/202507/15/150548u6u3qaggggnlui07.webp" alt="571b87bc0f770bbc30c645d297518cbab5135c55.webp" title="571b87bc0f770bbc30c645d297518cbab5135c55.webp" /></p>

kicc 发表于 2025-7-15 15:05:59

我也发现了,不管思考多久,他回答的一般是“你的问题”。
比起现在开局先夸你问题问的好,然后一通延伸,一堆注,括号解释的AI,这种“没有废话的高手”,或许才是正确的方向。

lifesinger 发表于 2025-7-15 15:06:33

<p>思考5分钟</p>
<p><img src="data/attachment/forum/202507/15/150628ikgi7a6g6tjsxoad.png" alt="图片.png" title="图片.png" /></p>

狂刷排名 发表于 2025-7-15 15:06:46

哈哈哈,你就说是不是1

示指哥 发表于 2025-7-15 15:06:59

下次试试问它‘为什么思考了八分钟才给我一个字’。看看它怎么编

cdlzguo 发表于 2025-7-15 15:07:08

很好,人狠话不多。

songxiao530 发表于 2025-7-15 15:07:20

没啥意义,无非就是format和默认tone的区别……你完全可以要求模型最终只输出答案,或者用structural output把答案放在某个项下面。这里并不是“惜字如金”,而是RL的时候懒得把中间过程输出来,而是统统藏在CoT里头。你的想法可能是对于非思考模型的(

实际上这可能是因为grok和o3类似的逻辑,也就是有的时候先枚举一个答案出来再拟合中间过程。

反过来讲,如果你问的问题比较模糊,例如里面实际上涉及多种情况或者说多个问题,然后他只给了一个回答,和你原来想问的不一样,那不是很容易误导人?

笨T笨 发表于 2025-7-15 15:07:29

目前第一梯队还是 O3 GEMINI 2.5 PRO 以及cloud 4

five 发表于 2025-7-15 15:07:39

grok4 回答也太简短了些

sasa516 发表于 2025-8-3 21:00:03

算后才知球半径
页: [1]
查看完整版本: grok 4真的惜字如金啊,思考了8分钟,结果回答了一个字