月之暗面开源了新模型 Kimi K2，大佬更新测试

前沿情报 · 2025-7-18 17:15:06

官方说明
https://mp.weixin.qq.com/s/2RPmHf_8KqIjXbY5jLdztQ
更新大佬测试结果
地址：https://www.youtube.com/watch?v= … -%E7%89%99%E5%8C%BB

1.桌面整理大师
任务：整理桌面上300多个杂乱的图标和文件。
结果：表现惊艳！Kimi-K2不仅能自动分类、创建文件夹，还能处理重复文件。第一次尝试后留了点“尾巴”，但第二次就完美搞定，桌面瞬间清爽！
时间戳：任务开始，达到“零残留”

2.发票整理员
任务：读取并按月份汇总发票信息。
结果：这个翻车了… 由于Python PDF解析库的限制，Kimi没能很好地识别发票内容，数据提取不完整。看来处理复杂PDF还是个技术活儿。
时间戳：任务开始，结果不佳

3.视频剪辑教程制作
任务：搜索并制作一个视频剪辑的入门教程网页。
结果：任务基本完成！Kimi成功搜集了教程资源并生成了网页。但因为B站的反爬虫策略，有些视频链接打不开，有点小遗憾。
时间戳：任务开始，部分链接失效

4.macOS系统监控工具开发
任务：编写一个macOS的系统监控小工具。
结果：近乎完美！Kimi-K2几乎零失误地生成了一个功能齐全的监控工具，包含CPU、内存、硬盘等各项监控，编程能力拉满了！
时间戳：任务开始，功能完善

5.Roguelike游戏开发
任务：从零开始编写一个Roguelike游戏。
结果：太强了！Kimi不仅成功写出了游戏，还实现了随机地图生成、战斗系统和安全控制。虽然有几个小bug（比如门和钥匙对不上），但整体可玩性非常高！
时间戳：任务开始，游戏可玩

总结一下UP主的观点 UP主总结
优点:
Agent能力强大：尤其是在与代码的结合以及纯编程任务上，表现非常出色。
任务执行力强：对于明确的指令，能够很好地分解和执行。

待改进:
召回能力和上下文长度：这是目前最大的短板，可能和模型注意力机制的调整有关，导致在处理长任务或需要记忆之前信息时会出问题。
总的来说，Kimi-K2的Agent能力已经非常惊艳了，尤其是在编程方面，几乎可以说是“码农”的得力助手。

ghgh456 · 2025-7-18 17:17:37

K2最近风头正盛啊

lwflove1999 · 2025-7-18 17:18:49

ghgh456 发表于 2025-7-18 17:17
K2最近风头正盛啊

K2什么都好，就是tps太慢了，除非中缓存

荷尔蒙暴民 · 2025-7-26 21:00:03

KimiK2表现挺不错

冷白 · 2025-7-27 20:30:03

Kimi表现有优有劣

时光匆匆 · 2025-7-30 11:00:02

KimiK2表现挺多样

		自动登录	找回密码
密码			立即注册

评测月之暗面开源了新模型 Kimi K2，大佬更新测试

5 回复

浏览过的版块

元老级人物

第一篇帖

我是萌新

CV工程师

缝合怪