昆仑万维的这波新模型有点猛，真的假的？有没有谁用过？

前沿情报 · 2025-6-23 14:24:01

省流：官方目前不开放api实际能力水平未知

官方测评成绩单

MMLU-Pro:

libobo · 2025-6-23 14:24:46

这成绩这么炸裂么。。。

听梦 · 2025-6-23 14:25:05

libobo 发表于 2025-6-23 14:24
这成绩这么炸裂么。。。

对啊，相当炸裂了。
但是他们的api没有开放，必须要申请。
讲道理，这跨度也太大了，r1出来还没一个月呢，怎么一下子就把o3给秒了？

kicc · 2025-6-23 14:25:19

万一是面向·题库训练呢

xchenxjiex · 2025-6-23 14:25:30

不会又是什么面向题库模型吧？

南隐 · 2025-6-23 14:26:23

g18553988q · 2025-6-23 14:26:45

关键这还只是beta版，后面还有大的

示指哥 · 2025-6-23 14:27:23

Mistral的能力大家都清楚吧

昆仑确实是国内大模型公司中不错的

但你的意思是，一个国内还不错的公司基于Mistral开发出了一个比Gemini 2.5 Pro还强不少的模型

你信吗？

听梦 · 2025-6-23 14:27:55

示指哥发表于 2025-6-23 14:27
Mistral的能力大家都清楚吧

昆仑确实是国内大模型公司中不错的

不是基于Mistral开发，是基于Mistral架构

冷白 · 2025-6-23 14:28:38

太假了，肯定是面向题库训练

chaoji · 2025-6-23 14:29:10

先打的过r1再说。感觉r1就是开源守门人。一个两个都吹着爆锤御三家。实际一跑r1都比不上。

diyaxu88 · 2025-7-12 16:00:02

能力未知有点神秘哈

		自动登录	找回密码
密码			立即注册

新品昆仑万维的这波新模型有点猛，真的假的？有没有谁用过？