对于gemini 2.5flash来说，产生幻觉仍是个大问题。

新虎爱 · 2025-8-13 15:23:53

至少展示出完整的提示内容，若能展示更多的聊天记录则更好，这对于证明你没有引导它说出那样的话总是很有帮助的。

美雷鹰 · 2025-8-13 15:52:16

终于！我还以为只有我有这种感觉，但网上的所有人，甚至连OpenAI子版块和Gemini相关讨论区的人都这么觉得。关于它，我有很多喜欢的地方，然而Flash有这些问题：
1. 忘了自己能做什么，老是说“很抱歉，我无法处理你上传的文件，只能处理你在提示词中发送的内容”这类话。
2. 在不超过三条消息之间就会忘记上下文，而且当它自我修正时，那种表现特别让人恼火，老是说“哦，对哦，那个，所以……”，可最后还是答错。

hai-er · 2025-8-13 16:04:55

哈哈Lol

bestcheer · 2025-8-13 17:59:54

如果双子座（这里可能是指某个语言模型）不回答这类问题会更好，因为它肯定会产生幻觉（指生成不合理内容）。但你们真的需要了解标记化（tokenization）是如何运作的，以及为什么这会让语言模型在处理这些问题时极其困难。

空气的影子 · 2025-8-13 22:14:56

🤣🤣🤣（这段内容本身就是通用的表情符号，无需翻译，原样保留就符合中国人语言习惯）

heronylee · 2025-8-14 09:30:01

在我看来，这似乎是一种语义上的误解。比如说，如果你问“‘color’这个单词拼写的时候带‘u’吗？”，那么我们会理解你是在问它是不是拼成“colour”而不是“color”，正常情况下（？），我们不会认为你在考虑把它拼成“culur”。同样，对于“strawberry”这个词，常见的混淆是在“strawberry”和“strawbery”之间，所以它选了“strawberry”并描述说它有两个“r”。提出语义清晰的问题时，它就能给出正确的回答。

dle5374 · 2025-8-14 09:57:58

说实话，我讨厌双子座，他们不仅不对，还很没礼貌。这种情况经常发生。

龙一品 · 2025-8-14 16:58:30

你是怎么表达自己问题的？你确定你的问法不会让人误会吗？可以参考上面那个 color 和 culur 的例子看看

请明月 · 2025-8-15 00:06:00

如果它不搞那六个提示、造出假的搜索结果，也就不会有这个问题了。我们真正需要的是：“你出现幻觉了” → 真实的谷歌搜索 → “抱歉，是的，我能做到”。

shenzhen · 2025-8-15 04:02:45

双子座认错时那股子自信劲儿，真是让人无语。

ak789@163.com · 2025-8-15 04:18:58

您这错误犯得还挺理直气壮的，真是让人无语。

酷新鹰儿 · 2025-8-15 05:57:48

问题是这样的，大多数AI呢，在你拿出足够证据之后，可能最后会承认自己错了。但就算我给双子座（这里应该是指某个AI模型）看了别人遇到同样问题的实际证据，它还是坚持己见，甚至在我连拼写这种基础问题都指出来时也死不认错。比如我问它：草莓这个词里的第三个字母是什么？第八个字母是第九个字母吗？它居然都回答是R，说里面有两个R。可实际上“草莓”这两个字里根本没有两个R啊！我平时其实不太跟AI较劲的，但这次真的有点气到了，心想这AI怎么这么容易被忽悠住呢？

秋之舞 · 2025-8-15 08:29:58

如果你真有个搞不懂的问题……

美熊悦 · 2025-8-15 10:48:03

我也是这么理解的……我觉得大模型没错，它又没被要求去数“strawberry”这个词里到底有几个r。如果问题是说“里面有两个r吗”，或者“有没有连续的r，出现在e后面、y前面”，那另说。我知道为啥大家会觉得困惑，但我倒不觉得这是模型在胡说八道，只是看问题的角度不一样而已。我可以很自然地想象有个人问另一个人：“你用两个r写strawberry吗？” 对方很可能理解成是问中间那两个连续的r，一个在e后面，一个在y前面，而不是去数整词里r的总数。

D某人 · 2025-8-16 00:01:23

当然可以，以下是口语化后的版本：是的，没错。

绿望光 · 2025-8-16 20:53:08

这是一点之后的内容

小念 · 2025-8-19 10:26:03

我和Gemini Pro争论说，Andor 第二季其实几天前就已经上线了。虽然我提供了好几个证据，但它一直非常坚定地认为根本没有发布。结果今天，它终于承认 Andor S2 确实是不久前发布的。

guojun_-2007 · 2025-8-23 09:00:03

打不开图咋评论呀

火神 · 2025-8-23 16:00:02

看不到图不好说呀

Rcpchina · 2025-9-5 10:30:03

打不开图片呀。

		自动登录	找回密码
密码			立即注册

交流对于gemini 2.5flash来说，产生幻觉仍是个大问题。

相关帖子

20 回复

渐入佳境