刚刚看了个视频,是个我个人认为有点水平的老外(前Twitch工程师)讲为什么Kimi-K2那么重要。主要观点其实就一个:和DeepSeek-R1一样,模型开源,你可以生成出无穷无尽的数据来训练别的模型。DeepSeek-R1让思考模型遍地开花,Kimi-K2可以让其他模型的工具调用有巨大的进步。
我看站内也有佬测试了工具调用,感觉褒贬不一?不过看视频里他夸的是挺厉害的。不知道佬们有什么想法。我个人在Cherry Studio里面做一些需要调用工具的事情的时候,kimi调工具确实挺不错的。
(补充)作者观点如下
- 现有模型(不管具体能力)能稳定靠谱的调用工具的,只有 Anthropic 和 OpenAI 的。
- Gemini 喜欢说自己想要用什么,但是不调用
- Grok 由于训练数据里有过多的 tool call,他喜欢调用他训练数据里的工具,而不是用户真的有的工具
- DeepSeek 暂时还没赶上这个
但是,有 Kimi 之后,我们直接用 Kimi 就可以生成很多类似的优秀的 tool call 数据来训练别的模型。
油管视频,需出境观看👇