就在这条热门帖子发布5小时后，OpenAI在国际数学奥林匹克竞赛中获得了金牌。

2z0y0z0 · 2025-7-24 14:13:55

哈哈

3261047364 · 2025-7-24 14:18:32

但是“人工智能只是一种工具。就像智能手机，或者印刷机一样。”

Christianrix · 2025-7-24 14:30:09

我觉得这种反感源于它具有误导性。OpenAI称其模型得分高到足以获得金牌，这与一个排名未进前三的机器人可是大不相同。这是两种不同的说法，哪种更真实，取决于不同的视角。说模型表现不如人类，这忽视了模型能够达到那种竞争水平本身就是一项成就。要知道，实际上几乎所有人类都达不到那种竞争水平，在这种情况下这么说就显得很没眼力见。另一方面，没有人工智能模型是官方参赛选手。那些参赛的模型是独立测试的，而且国际数学奥林匹克竞赛（IMO）无法独立验证结果，所以我们无法百分百确定OpenAI的说法完全站得住脚。

忄_bEZgX · 2025-7-24 14:32:50

我说实话，我觉得这里的人经常会因为有人指出人工智能能力方面的缺陷而生气，这简直有点盲目崇拜了。说这些模型都没有达到铜牌水平，这对于未来的改进或者评判标准而言，根本说明不了什么。

fxpk · 2025-7-24 15:50:56

批评应该是探讨原因，而那不过是一个吸引反人工智能群体转发的诱饵帖。其中的暗示很明显。没人被冒犯，只是这事儿过时得如此之快，实在好笑。他后续的认错声明在哪儿呢？

夏天的小夜曲 · 2025-7-24 15:54:54

ChatGPT把一个简单的时区计算搞砸了，所以我不知道（该怎么办）。

美雷鹰 · 2025-7-24 16:10:19

嗯。这第五个绝佳的妙语。美好时光啊。

wanpin · 2025-7-24 16:13:55

我记得曾经并非如此。那时一切都很美好。

风中漫步 · 2025-7-24 16:34:13

活动结束后该模特就不再参赛了，你这话是什么意思？活动都结束了，它不就不会再参赛了吗？

tccrock · 2025-7-24 17:16:17

你一定是刚到这儿。

2z0y0z0 · 2025-7-25 05:24:23

如果你走到哪儿都能闻到香酥炸鸡的味道……

快凤龙 · 2025-7-25 07:51:19

什么时候？在某个平行宇宙里吗？

wanggang761029 · 2025-7-25 09:59:59

一台电脑？数学还很好？这怎么可能呢？

杨骏 · 2025-7-25 10:18:59

如果那些本应获胜的模型能够在其他竞赛中复制其成功就好了。让我们拭目以待六个月后会发生什么。如果你没有看到其他任何模型能够在其他竞赛中复制OpenAI的成功，那就更能证明OpenAI的成功了。

zxzh0003 · 2025-7-25 12:02:57

计算机一直擅长算术，但这是“纯数学”领域。它能够处理文字问题，然后“证明”它。它不借助工具，完全通过语言解决了问题。

星光灿烂 · 2025-7-25 13:26:06

说实话，这让我想起了《黑镜》里的某些情节。

Ivycipher · 2025-7-26 08:00:39

这些模型没有一个能获得铜牌，这让你感到惊讶吗？我也觉得有点意外，当然这并非是要低估目前取得的进展或未来的潜力。当我在网上看到有人说这些模型甚至都不具备推理能力时，我就觉得他们显然是错的，但我感觉有些人对此反应过度了。

duck25 · 2025-7-28 06:57:55

因为这是在转移目标，忽视取得的进展，并且低估未来改进的速度。

besos · 2025-7-29 20:04:48

有点误会。在国际数学奥林匹克竞赛（IMO）上，一批大语言模型参赛了，但表现不佳。竞赛结束后，OpenAI宣布一个尚未发布的新模型获得了金牌。国际数学奥林匹克竞赛方面验证了证明过程，但由于该模型是在竞赛结束后才公布的，且并未实际参赛，所以有充分理由对此表示怀疑。

neverletgo · 2025-7-30 06:20:35

没有使用工具。完全是基于大语言模型（LLM）。

橙花月 · 2025-7-30 12:09:25

他们确实声称，这一结果是通过一个 “通用型” 模型取得的。如果这是真的，那意义重大，原因如下：在 “通用型” 模型层面，即便有大量数据，要让模型出现过拟合都极为困难，不然就会导致模型崩溃。所以，如果它能在国际数学奥林匹克竞赛（IMO，该竞赛要求严谨的数学证明和推理）中拿到金牌，那么给它再多输入一些数据，让它在人类已知的其他所有考试中取得优异成绩，基本就是小菜一碟。而且（有可能）还能指导它解决实际的新问题。此前人工智能在解决国际数学奥林匹克竞赛问题上的最佳成果是谷歌的 AlphaProof 去年取得的（获得银牌）。但在将人工智能应用于既定逻辑框架来解决问题之前，它是在一个预先设定好的逻辑框架下运行的。如果OpenAI的说法属实，那就证明，仅仅靠含糊的基于文字的推理就可能足以达到超越人类的智能水平。不过话说回来，这只是一个很大的 “如果”，一切都在不公开的情况下进行。据我们所知，OpenAI办公室里说不定有 “独角兽”（指极其出色的成果），只是没人对此大肆宣扬罢了。

扯淡 · 2025-8-1 14:59:06

据我所知，这条推文是在实验模型发布之前发布的。不管这与人类的一般能力有怎样的关联，一个经过一年多测试的专业模型只差一分就能拿到满分（金牌），考虑到从那以后推理能力方面取得的所有进展，期待通用模型能表现得更好一点，这并非不合理。

g25125949m · 2025-8-6 12:16:21

简直是个谜。

美光 · 2025-8-8 14:54:31

可我确实是这样。而且，数学甚至都不是我在这里要说的重点。

reverie · 2025-8-11 06:24:38

就说你对数学一窍不通。

灰兔 · 2025-8-16 07:28:10

我觉得你这个问题挺有意思的，我来试着用更口语化、更接地气的方式重新表达一下你的这段话，同时保留原有的结构和换行：考虑到这个问题是几天前才发布的，我觉得根本没那么多时间去做什么像样的LLM模型训练。所以这次的结果才会这么让人吃惊。再说了，我也没印象OpenAI以前宣布过什么AI模型拿过金牌之类的消息。你该不会是在说那个防alphproof吧？那个其实是Google专门用来生成数学证明的模型，它还用了像Alphageometry2这样的额外模块，最后拿了银牌。他们论文发布时间大概是在2024年IMO问题公布后一周左右。所以它也没训练个半年啥的。你能再解释一下你说的是什么意思吗？（编辑：改了一些语法错误）如果你还有其他内容需要“翻译”成更轻松、易懂的中文，随时告诉我！

		自动登录	找回密码
密码			立即注册

就在这条热门帖子发布5小时后，OpenAI在国际数学奥林匹克竞赛中获得了金牌。

相关帖子

26 回复