发帖
 找回密码
 立即注册
搜索
0 0 0
日常闲聊 331 0 昨天 14:43

模型:Gemini-2.5-pro

问题:`9.11-9.9=`

  1. 不用code execution:经过长时间推理,大概率回答:-0.79
  2. 用code execution:大概率代码运行结果:-0.7900000000000009, 回答:0.21

(官网默认使用code execution,aistudio可以选择是否启用code execution)

猜测:gemini不能用代码方式计算浮点数运算

──── 0人觉得很赞 ────

使用道具 举报

代码算得是对的,只是他太自信了,一直觉得自己肯定是对的。他展示的正确代码实际上并没有真正运行起来,或者根本就没用上 。
因为大语言模型(LLM)本质是“查询数据库”,并不具备“算术运算”能力。  
是的,感觉调用工具的能力还是太弱了,希望3.0能强化一下。  
大部分AI算得对不对
PixPin_20250925_143244
737×597 18.4 KB
大语言模型(LLM)本质上和输入法的联想功能没啥区别(
如果你使用官网,那它会非常自信。即便代码执行器显示结果是 0.79,它依然觉得自己算出的 0.21 是正确的。

Google 官方的神级提示词 / 自信的 Gemini  资源荟萃  LINUX DO
转自上贴:
模型:双子座2.5专业版
双子座(Gemini)的本质就像是做完形填空。它把人类的所有文字资料都吸纳进去,然后依据你的问题,按照一定的概率进行“填空”式排列 。  
您需要登录后才可以回帖 立即登录
高级模式