发帖
 找回密码
 立即注册
搜索
1 0 0
日常闲聊 129 1 7 小时前

怎么感觉 OpenAI 每次发新模型之前先发的匿名模型都比正式模型要强

大家有这样的感觉吗?

比如 GPT-4.1 之前在 OpenRouter 测的两个 Alpha 模型,因为现在找不到了,所以也不好实测,不过 Aider 上有他们的评分

原本大家的推测是 Quasar Alpha 是 GPT-4.1,Optimus Alpha 是 GPT-4.1 mini,实际上呢?GPT-4.1 的最终评分连这两个匿名模型都达不到
ffab68edac2b244a61194ba94efb0e3ab422b92a.webp

──── 0人觉得很赞 ────

使用道具 举报

抢个沙发,这样别人就抢不到啦。
这让我想起了谷歌的Kingfall,真怀念它啊。
目前在竞技场上进行测试的大部分谷歌模型,都是在Gemini 2.5 Pro GA版本发布之后上线的,这里面不包括正式模型发布前用于预热的匿名模型。  
怎么感觉OpenAI每次在发布新模型之前所发的匿名模型,都比正式模型更厉害呢
谷歌也是这样,成本高且不稳定吧
应该是有个过程的
您需要登录后才可以回帖 立即登录
高级模式