发帖
 找回密码
 立即注册
搜索
20 0 0
日常闲聊 991 20 2025-8-13 13:39:20
──── 0人觉得很赞 ────

使用道具 举报

2025-8-13 15:23:53
至少展示出完整的提示内容,若能展示更多的聊天记录则更好,这对于证明你没有引导它说出那样的话总是很有帮助的。  
2025-8-13 15:52:16
终于!我还以为只有我有这种感觉,但网上的所有人,甚至连OpenAI子版块和Gemini相关讨论区的人都这么觉得。关于它,我有很多喜欢的地方,然而Flash有这些问题:
1. 忘了自己能做什么,老是说“很抱歉,我无法处理你上传的文件,只能处理你在提示词中发送的内容”这类话。
2. 在不超过三条消息之间就会忘记上下文,而且当它自我修正时,那种表现特别让人恼火,老是说“哦,对哦,那个,所以……”,可最后还是答错 。  
2025-8-13 16:04:55
哈哈Lol
2025-8-13 17:59:54
如果双子座(这里可能是指某个语言模型)不回答这类问题会更好,因为它肯定会产生幻觉(指生成不合理内容)。但你们真的需要了解标记化(tokenization)是如何运作的,以及为什么这会让语言模型在处理这些问题时极其困难 。  
🤣🤣🤣(这段内容本身就是通用的表情符号,无需翻译,原样保留就符合中国人语言习惯 )  
2025-8-14 09:30:01
在我看来,这似乎是一种语义上的误解。比如说,如果你问“‘color’这个单词拼写的时候带‘u’吗?”,那么我们会理解你是在问它是不是拼成“colour”而不是“color”,正常情况下(?),我们不会认为你在考虑把它拼成“culur”。同样,对于“strawberry”这个词,常见的混淆是在“strawberry”和“strawbery”之间,所以它选了“strawberry”并描述说它有两个“r”。提出语义清晰的问题时,它就能给出正确的回答。
2025-8-14 09:57:58
说实话,我讨厌双子座,他们不仅不对,还很没礼貌。这种情况经常发生。  
2025-8-14 16:58:30
你是怎么表达自己问题的?你确定你的问法不会让人误会吗?可以参考上面那个 color 和 culur 的例子看看
2025-8-15 00:06:00
如果它不搞那六个提示、造出假的搜索结果,也就不会有这个问题了。我们真正需要的是:“你出现幻觉了” → 真实的谷歌搜索 → “抱歉,是的,我能做到”。
2025-8-15 04:02:45
双子座认错时那股子自信劲儿,真是让人无语。
您这错误犯得还挺理直气壮的,真是让人无语。
2025-8-15 05:57:48
问题是这样的,大多数AI呢,在你拿出足够证据之后,可能最后会承认自己错了。但就算我给双子座(这里应该是指某个AI模型)看了别人遇到同样问题的实际证据,它还是坚持己见,甚至在我连拼写这种基础问题都指出来时也死不认错。比如我问它:草莓这个词里的第三个字母是什么?第八个字母是第九个字母吗?它居然都回答是R,说里面有两个R。可实际上“草莓”这两个字里根本没有两个R啊!我平时其实不太跟AI较劲的,但这次真的有点气到了,心想这AI怎么这么容易被忽悠住呢?
2025-8-15 08:29:58
如果你真有个搞不懂的问题……
2025-8-15 10:48:03
我也是这么理解的……我觉得大模型没错,它又没被要求去数“strawberry”这个词里到底有几个r。如果问题是说“里面有两个r吗”,或者“有没有连续的r,出现在e后面、y前面”,那另说。我知道为啥大家会觉得困惑,但我倒不觉得这是模型在胡说八道,只是看问题的角度不一样而已。我可以很自然地想象有个人问另一个人:“你用两个r写strawberry吗?” 对方很可能理解成是问中间那两个连续的r,一个在e后面,一个在y前面,而不是去数整词里r的总数。
2025-8-16 00:01:23
当然可以,以下是口语化后的版本:是的,没错。
2025-8-16 20:53:08
这是一点之后的内容
2025-8-19 10:26:03
我和Gemini Pro争论说,Andor 第二季其实几天前就已经上线了。虽然我提供了好几个证据,但它一直非常坚定地认为根本没有发布。结果今天,它终于承认 Andor S2 确实是不久前发布的。
2025-8-23 09:00:03
打不开图咋评论呀
2025-8-23 16:00:02
看不到图不好说呀
2025-9-5 10:30:03
打不开图片呀。
您需要登录后才可以回帖 立即登录
高级模式