登录发现更多内容
首页
板块
ai工具
导读
发帖
用户名
Email
自动登录
找回密码
密码
登录
立即注册
登录
立即登录
立即注册
微信登陆
首页
版块
BBS
导读
任务
Nano Banana
小旺AI截图
发帖
搜索
搜索
热搜:
活动
交友
discuz
本版
文章
帖子
用户
收藏
道具
勋章
任务
门户
导读
排行榜
设置
我的收藏
退出
20
0
0
首页
日常闲聊
›
对于gemini 2.5flash来说,产生幻觉仍是个大问题。 ...
返回列表
交流
对于gemini 2.5flash来说,产生幻觉仍是个大问题。
[ 复制链接 ]
chyyjt2005
UID:394
萌新
发布新帖
日常闲聊
991
20
2025-8-13 13:39:20
BigSeek
双子星25kit
点赞
0
收藏
0
────
0
人觉得很赞
────
相关帖子
唉,真挺惨的
你想找一款不错的旧款R1?OpenRouter one是完整的型号名字吗?
OpenAI现在搞得用户越来越不信任他们了
Wan Animate工作流程——轻松替换任何视频里的角色
数学家们说,GPT5现在已经有能力搞定一些小型的开放性数学问题了,这类问题通常得让一个优秀的博士生花上一天甚至好几天才能解决。
这儿没啥好说的
WAN2.2 VACE | comfyUI
彼得·泰尔说,搞太多人工智能监管,反而会加速“敌基督者”的出现。
这也太离谱了吧!Wan animate 这也太牛了!
听听程序员们都在说啥
回复
使用道具
举报
20 回复
新虎爱
回复
使用道具
举报
2025-8-13 15:23:53
至少展示出完整的提示内容,若能展示更多的聊天记录则更好,这对于证明你没有引导它说出那样的话总是很有帮助的。
回复
点赞
评论
使用道具
举报
美雷鹰
回复
使用道具
举报
2025-8-13 15:52:16
终于!我还以为只有我有这种感觉,但网上的所有人,甚至连OpenAI子版块和Gemini相关讨论区的人都这么觉得。关于它,我有很多喜欢的地方,然而Flash有这些问题:
1. 忘了自己能做什么,老是说“很抱歉,我无法处理你上传的文件,只能处理你在提示词中发送的内容”这类话。
2. 在不超过三条消息之间就会忘记上下文,而且当它自我修正时,那种表现特别让人恼火,老是说“哦,对哦,那个,所以……”,可最后还是答错 。
回复
点赞
评论
使用道具
举报
hai-er
回复
使用道具
举报
2025-8-13 16:04:55
哈哈Lol
回复
点赞
评论
使用道具
举报
bestcheer
回复
使用道具
举报
2025-8-13 17:59:54
如果双子座(这里可能是指某个语言模型)不回答这类问题会更好,因为它肯定会产生幻觉(指生成不合理内容)。但你们真的需要了解标记化(tokenization)是如何运作的,以及为什么这会让语言模型在处理这些问题时极其困难 。
回复
点赞
评论
使用道具
举报
空气的影子
回复
使用道具
举报
2025-8-13 22:14:56
🤣🤣🤣(这段内容本身就是通用的表情符号,无需翻译,原样保留就符合中国人语言习惯 )
回复
点赞
评论
使用道具
举报
heronylee
回复
使用道具
举报
2025-8-14 09:30:01
在我看来,这似乎是一种语义上的误解。比如说,如果你问“‘color’这个单词拼写的时候带‘u’吗?”,那么我们会理解你是在问它是不是拼成“colour”而不是“color”,正常情况下(?),我们不会认为你在考虑把它拼成“culur”。同样,对于“strawberry”这个词,常见的混淆是在“strawberry”和“strawbery”之间,所以它选了“strawberry”并描述说它有两个“r”。提出语义清晰的问题时,它就能给出正确的回答。
回复
点赞
评论
使用道具
举报
dle5374
回复
使用道具
举报
2025-8-14 09:57:58
说实话,我讨厌双子座,他们不仅不对,还很没礼貌。这种情况经常发生。
回复
点赞
评论
使用道具
举报
龙一品
回复
使用道具
举报
2025-8-14 16:58:30
你是怎么表达自己问题的?你确定你的问法不会让人误会吗?可以参考上面那个 color 和 culur 的例子看看
回复
点赞
评论
使用道具
举报
请明月
回复
使用道具
举报
2025-8-15 00:06:00
如果它不搞那六个提示、造出假的搜索结果,也就不会有这个问题了。我们真正需要的是:“你出现幻觉了” → 真实的谷歌搜索 → “抱歉,是的,我能做到”。
回复
点赞
评论
使用道具
举报
shenzhen
回复
使用道具
举报
2025-8-15 04:02:45
双子座认错时那股子自信劲儿,真是让人无语。
回复
点赞
评论
使用道具
举报
ak789@163.com
回复
使用道具
举报
2025-8-15 04:18:58
您这错误犯得还挺理直气壮的,真是让人无语。
回复
点赞
评论
使用道具
举报
酷新鹰儿
回复
使用道具
举报
2025-8-15 05:57:48
问题是这样的,大多数AI呢,在你拿出足够证据之后,可能最后会承认自己错了。但就算我给双子座(这里应该是指某个AI模型)看了别人遇到同样问题的实际证据,它还是坚持己见,甚至在我连拼写这种基础问题都指出来时也死不认错。比如我问它:草莓这个词里的第三个字母是什么?第八个字母是第九个字母吗?它居然都回答是R,说里面有两个R。可实际上“草莓”这两个字里根本没有两个R啊!我平时其实不太跟AI较劲的,但这次真的有点气到了,心想这AI怎么这么容易被忽悠住呢?
回复
点赞
评论
使用道具
举报
秋之舞
回复
使用道具
举报
2025-8-15 08:29:58
如果你真有个搞不懂的问题……
回复
点赞
评论
使用道具
举报
美熊悦
回复
使用道具
举报
2025-8-15 10:48:03
我也是这么理解的……我觉得大模型没错,它又没被要求去数“strawberry”这个词里到底有几个r。如果问题是说“里面有两个r吗”,或者“有没有连续的r,出现在e后面、y前面”,那另说。我知道为啥大家会觉得困惑,但我倒不觉得这是模型在胡说八道,只是看问题的角度不一样而已。我可以很自然地想象有个人问另一个人:“你用两个r写strawberry吗?” 对方很可能理解成是问中间那两个连续的r,一个在e后面,一个在y前面,而不是去数整词里r的总数。
回复
点赞
评论
使用道具
举报
D某人
回复
使用道具
举报
2025-8-16 00:01:23
当然可以,以下是口语化后的版本:是的,没错。
回复
点赞
评论
使用道具
举报
绿望光
回复
使用道具
举报
2025-8-16 20:53:08
这是一点之后的内容
回复
点赞
评论
使用道具
举报
小念
回复
使用道具
举报
2025-8-19 10:26:03
我和Gemini Pro争论说,Andor 第二季其实几天前就已经上线了。虽然我提供了好几个证据,但它一直非常坚定地认为根本没有发布。结果今天,它终于承认 Andor S2 确实是不久前发布的。
回复
点赞
评论
使用道具
举报
guojun_-2007
回复
使用道具
举报
2025-8-23 09:00:03
打不开图咋评论呀
回复
点赞
评论
使用道具
举报
火神
回复
使用道具
举报
2025-8-23 16:00:02
看不到图不好说呀
回复
点赞
评论
使用道具
举报
Rcpchina
回复
使用道具
举报
2025-9-5 10:30:03
打不开图片呀。
回复
点赞
评论
使用道具
举报
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
立即登录
微信登陆
点评
高级模式
本版积分规则
回帖后跳转到最后一页
渐入佳境
哎呦不错,拥有了10根鸡腿🍗
最新回复
1
OSSGPT120b F16 对比 GLM4.5AirUDQ4KXL
2
唉,真挺惨的
3
光想着搞出超级智能,美国反而在真正的人工智能竞争里掉队了。
4
路由在4o和5上都是有意设计的:可能会出现什么情况,以及我们能
5
反AI的苦涩:我终于想明白了
6
你想找一款不错的旧款R1?OpenRouter one是完整的型号名字吗?
7
写了一个Prompt可以将任何文字转化成一个专业报告
8
OpenAI现在搞得用户越来越不信任他们了
推荐版块
日常闲聊
资源分享
快问快答
教程文档
福利活动
统计信息
会员数: 1311 个
话题数: 21956 篇
巅峰数: 144 人
首页
板块
AI工具
导读
我的