官方说明
https://mp.weixin.qq.com/s/2RPmHf_8KqIjXbY5jLdztQ
更新大佬测试结果
地址:https://www.youtube.com/watch?v= … -%E7%89%99%E5%8C%BB
1.桌面整理大师
任务:整理桌面上300多个杂乱的图标和文件。
结果:表现惊艳!Kimi-K2不仅能自动分类、创建文件夹,还能处理重复文件。第一次尝试后留了点“尾巴”,但第二次就完美搞定,桌面瞬间清爽!
时间戳:任务开始,达到“零残留”
2.发票整理员
任务:读取并按月份汇总发票信息。
结果:这个翻车了… 由于Python PDF解析库的限制,Kimi没能很好地识别发票内容,数据提取不完整。看来处理复杂PDF还是个技术活儿。
时间戳:任务开始,结果不佳
3.视频剪辑教程制作
任务:搜索并制作一个视频剪辑的入门教程网页。
结果:任务基本完成!Kimi成功搜集了教程资源并生成了网页。但因为B站的反爬虫策略,有些视频链接打不开,有点小遗憾。
时间戳:任务开始,部分链接失效
4.macOS系统监控工具开发
任务:编写一个macOS的系统监控小工具。
结果:近乎完美!Kimi-K2几乎零失误地生成了一个功能齐全的监控工具,包含CPU、内存、硬盘等各项监控,编程能力拉满了!
时间戳:任务开始,功能完善
5.Roguelike游戏开发
任务:从零开始编写一个Roguelike游戏。
结果:太强了!Kimi不仅成功写出了游戏,还实现了随机地图生成、战斗系统和安全控制。虽然有几个小bug(比如门和钥匙对不上),但整体可玩性非常高!
时间戳:任务开始,游戏可玩
总结一下UP主的观点 UP主总结
优点:
Agent能力强大:尤其是在与代码的结合以及纯编程任务上,表现非常出色。
任务执行力强:对于明确的指令,能够很好地分解和执行。
待改进:
召回能力和上下文长度:这是目前最大的短板,可能和模型注意力机制的调整有关,导致在处理长任务或需要记忆之前信息时会出问题。
总的来说,Kimi-K2的Agent能力已经非常惊艳了,尤其是在编程方面,几乎可以说是“码农”的得力助手。 |