发帖
 找回密码
 立即注册
搜索
2 1 0
前沿情报 43 2 5 小时前
官方说明
https://mp.weixin.qq.com/s/2RPmHf_8KqIjXbY5jLdztQ
更新大佬测试结果
地址:https://www.youtube.com/watch?v= … -%E7%89%99%E5%8C%BB

1.桌面整理大师
任务:整理桌面上300多个杂乱的图标和文件。
结果:表现惊艳!Kimi-K2不仅能自动分类、创建文件夹,还能处理重复文件。第一次尝试后留了点“尾巴”,但第二次就完美搞定,桌面瞬间清爽!
时间戳:任务开始达到“零残留”

2.发票整理员
任务:读取并按月份汇总发票信息。
结果:这个翻车了… 由于Python PDF解析库的限制,Kimi没能很好地识别发票内容,数据提取不完整。看来处理复杂PDF还是个技术活儿。
时间戳:任务开始结果不佳

3.视频剪辑教程制作
任务:搜索并制作一个视频剪辑的入门教程网页。
结果:任务基本完成!Kimi成功搜集了教程资源并生成了网页。但因为B站的反爬虫策略,有些视频链接打不开,有点小遗憾。
时间戳:任务开始部分链接失效

4.macOS系统监控工具开发
任务:编写一个macOS的系统监控小工具。
结果:近乎完美!Kimi-K2几乎零失误地生成了一个功能齐全的监控工具,包含CPU、内存、硬盘等各项监控,编程能力拉满了!
时间戳:任务开始功能完善

5.Roguelike游戏开发
任务:从零开始编写一个Roguelike游戏。
结果:太强了!Kimi不仅成功写出了游戏,还实现了随机地图生成、战斗系统和安全控制。虽然有几个小bug(比如门和钥匙对不上),但整体可玩性非常高!
时间戳:任务开始游戏可玩



总结一下UP主的观点 UP主总结
优点:
Agent能力强大:尤其是在与代码的结合以及纯编程任务上,表现非常出色。
任务执行力强:对于明确的指令,能够很好地分解和执行。

待改进:
召回能力和上下文长度:这是目前最大的短板,可能和模型注意力机制的调整有关,导致在处理长任务或需要记忆之前信息时会出问题。
总的来说,Kimi-K2的Agent能力已经非常惊艳了,尤其是在编程方面,几乎可以说是“码农”的得力助手。
──── 1人觉得很赞 ────

使用道具 举报

K2最近风头正盛啊
ghgh456 发表于 2025-7-18 17:17
K2最近风头正盛啊

K2什么都好,就是tps太慢了,除非中缓存
您需要登录后才可以回帖 立即登录
高级模式