Kimi K2的意义
<p>刚刚看了个视频,是个我个人认为有点水平的老外(前Twitch工程师)讲为什么Kimi-K2那么重要。主要观点其实就一个:和DeepSeek-R1一样,模型开源,你可以生成出无穷无尽的数据来训练别的模型。DeepSeek-R1让思考模型遍地开花,Kimi-K2可以让其他模型的工具调用有巨大的进步。</p><p>我看站内也有佬测试了工具调用,感觉褒贬不一?不过看视频里他夸的是挺厉害的。不知道佬们有什么想法。我个人在Cherry Studio里面做一些需要调用工具的事情的时候,kimi调工具确实挺不错的。</p>
<p>(补充)作者观点如下</p>
<ul>
<li>现有模型(不管具体能力)能稳定靠谱的调用工具的,只有 Anthropic 和 OpenAI 的。</li>
<li>Gemini 喜欢说自己想要用什么,但是不调用</li>
<li>Grok 由于训练数据里有过多的 tool call,他喜欢调用他训练数据里的工具,而不是用户真的有的工具</li>
<li>DeepSeek 暂时还没赶上这个</li>
</ul>
<p>但是,有 Kimi 之后,我们直接用 Kimi 就可以生成很多类似的优秀的 tool call 数据来训练别的模型。</p>
<p>油管视频,需出境观看👇</p>
<iframe width="560" height="315" src="https://www.youtube.com/embed/xLFkqYOUN24?si=qT3JXfHF_QuUPt06" title="YouTube video player" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share" referrerpolicy="strict-origin-when-cross-origin" allowfullscreen=""></iframe>
省流:一个基模 等一个开发结果,官网的体验虽然不好,或许能靠大佬们加强完善整出新东西? 理解代码比ds v3强点,别的没看出来 开源模型迈入T量级参数了 现在喷kimi感觉已经是zzzq了,不管好坏都喷
这个不是思考模型,作为基模来说效果还说得过去,而且还开源 K2的指令遵循能力确实不错的,工具调用能力在开源模型里的确是最好的。 虽然体验不太好,但大家都挺推崇的,看来是不错。虽然看上去比DeepSeek差不少 Kimi真有这么神? Kimi真有那么神?
页:
[1]