发帖
 找回密码
 立即注册
搜索
0 0 0
日常闲聊 639 0 2025-8-27 10:22:06
  • 总宽度 = 200 + 202 + 102 = 260px
  • 总高度 = 100 + 202 + 102 = 160px

之前在拍照,让AI算术的时候就发现,虽然文字提取都是正确的,但是Gemini,GPT4都算不对,豆包却十几张图片算术都是对的。

上次的图

1341dc1aa973aa59ef23f66b6f9ed941e0191477.jpeg
降智也不带这么离谱的吧

──── 0人觉得很赞 ────

使用道具 举报

2025-8-27 12:07:23
大帅哥来晚喽,过了这么长时间才回消息呀
2025-8-27 13:42:30
按照阅读顺序输出图中所有阿拉伯数字的分数,输出格式为a/b,用逗号分隔。
2025-8-27 16:07:24
我最近也在琢磨怎么识别对,蹲一个解决办法,或者能解决问题的模型(是大语言模型LLM,不是OCR工具 )  
2025-8-27 16:47:26
包括豆包,GPT5 也好,Gemini2.5pro 也罢,它们思考与否先不论。

但是人类只要稍微认真一点,都能看清楚,

现在模型还没那么强大。
2025-8-28 12:27:04
这么离谱
2025-8-28 14:18:03
但我觉得这种并非是一种难度级别上的
2025-8-28 15:38:08
上个图呗
那就不清楚了,毕竟豆包不会显示有没有调用工具这类情况,从实际效果来看,应该确实在这方面做了优化。
图片 1757×804  15KB
反正是挺夸张的
关键是懒得用OCR再去计算了。其实这也没什么大不了的,豆包能替代。不过在正常对话里出现计算错误,就挺折磨人的。
我觉得还不如相信MCP的价值。现有工具能解决的问题,何必非得让LLM自己来做呢(估计那些高手也是嫌麻烦吧,直接丢给对话了事 )
您需要登录后才可以回帖 立即登录
高级模式