发帖
 找回密码
 立即注册
搜索
10 4 0
前沿情报 120 10 昨天 14:24
省流:官方目前不开放api实际能力水平未知
官方测评成绩单
11f2e49e313f1825dc71c28113b5d6da021df562.webp
MMLU-Pro:
71833b83732c07db43a48656c23dd4677ea3138b.webp
github: SkyworkAI/MindLink
──── 4人觉得很赞 ────

使用道具 举报

这成绩这么炸裂么。。。
听梦
昨天 14:25
对啊,相当炸裂了。 但是他们的api没有开放,必须要申请。 讲道理,这跨度也太大了,r1出来还没一个月呢,怎么一下子就把o3给秒了?  详情 回复
昨天 14:25
libobo 发表于 2025-6-23 14:24
这成绩这么炸裂么。。。

对啊,相当炸裂了。
但是他们的api没有开放,必须要申请。
讲道理,这跨度也太大了,r1出来还没一个月呢,怎么一下子就把o3给秒了?
昨天 14:25
万一是面向·题库训练呢
不会又是什么面向题库模型吧?
0b732308ea8eb8a86c381a29d26f5e763818c85d.jpeg
关键这还只是beta版,后面还有大的 5d3185a8e899ef3490a8f7b8eef31e8fa3c3c5ea.webp
Mistral的能力大家都清楚吧

昆仑确实是国内大模型公司中不错的

但你的意思是,一个国内还不错的公司基于Mistral开发出了一个比Gemini 2.5 Pro还强不少的模型

你信吗?
听梦
昨天 14:27
不是基于Mistral开发,是基于Mistral架构[attachimg]1217[/attachimg]  详情 回复
昨天 14:27
示指哥 发表于 2025-6-23 14:27
Mistral的能力大家都清楚吧

昆仑确实是国内大模型公司中不错的

不是基于Mistral开发,是基于Mistral架构 4093aff0621b9124aa19da3fbe3834277053d40e.webp
太假了,肯定是面向题库训练
先打的过r1再说。感觉r1就是开源守门人。一个两个都吹着爆锤御三家。实际一跑r1都比不上。
您需要登录后才可以回帖 立即登录
高级模式