发帖
 找回密码
 立即注册
搜索
7 2 0
日常闲聊 84 7 10 小时前

刚刚看了个视频,是个我个人认为有点水平的老外(前Twitch工程师)讲为什么Kimi-K2那么重要。主要观点其实就一个:和DeepSeek-R1一样,模型开源,你可以生成出无穷无尽的数据来训练别的模型。DeepSeek-R1让思考模型遍地开花,Kimi-K2可以让其他模型的工具调用有巨大的进步。

我看站内也有佬测试了工具调用,感觉褒贬不一?不过看视频里他夸的是挺厉害的。不知道佬们有什么想法。我个人在Cherry Studio里面做一些需要调用工具的事情的时候,kimi调工具确实挺不错的。

(补充)作者观点如下

  • 现有模型(不管具体能力)能稳定靠谱的调用工具的,只有 Anthropic 和 OpenAI 的。
  • Gemini 喜欢说自己想要用什么,但是不调用
  • Grok 由于训练数据里有过多的 tool call,他喜欢调用他训练数据里的工具,而不是用户真的有的工具
  • DeepSeek 暂时还没赶上这个

但是,有 Kimi 之后,我们直接用 Kimi 就可以生成很多类似的优秀的 tool call 数据来训练别的模型。

油管视频,需出境观看👇

──── 2人觉得很赞 ────

使用道具 举报

省流:一个基模
等一个开发结果,官网的体验虽然不好,或许能靠大佬们加强完善整出新东西?
理解代码比ds v3强点,别的没看出来
开源模型迈入T量级参数了
现在喷kimi感觉已经是zzzq了,不管好坏都喷
这个不是思考模型,作为基模来说效果还说得过去,而且还开源
K2的指令遵循能力确实不错的,工具调用能力在开源模型里的确是最好的。
虽然体验不太好,但大家都挺推崇的,看来是不错。虽然看上去比DeepSeek差不少
您需要登录后才可以回帖 立即登录
高级模式