发帖
 找回密码
 立即注册
搜索
8 1 0
日常闲聊 73 8 9 小时前

我一直觉得一个大模型出来符合自己某方面的要求加入自己的收藏夹有需要时候用它即可,如果一个大模型出来不符合自己的要求扔掉即可,就像扔掉llama4和mistralai的模型。
至于长时间的发帖黑某个模型的动机很奇怪,应该是自己不用也不希望其他人使用。
从这个角度来说Kimi黑粉还是满失败的,最近看了一些openrouter的统计数据,Kimi V2从编程榜单(openrouter最有价值的榜单)的第10名 到 第7名,今天来超越grok4到第4名

6544ef76620b943b9248c2d070bb3a0578f212e2.webp

有创意写作需求,同时测试claude4、V3.1和Kimi K2,发现提示词模糊不准确的时候claude4、V3.1的表现强于Kimi K2,但是当调整提示词符合规范的时候,发现三个模型同时满足提示要求,V3.1和Kimi K2同时具有很强的想象力和感染力,但是V3.1的逻辑感略差,而claude4写的文章读起来味同嚼蜡、平淡若水,Kimi K2则是三个里面最惊艳的

──── 1人觉得很赞 ────

使用道具 举报

从使用次数很容易能看出 claude sonnet 4是编程第一。 至于K2我倒感觉真的很一般般,花了大半年终于追上v3,真的有点落后了
ss20052008
9 小时前
claude家的代码库数据比GitHub还多几倍,国内应该是没有那么高质量的数据  详情 回复
9 小时前
tzjj 发表于 2025-7-22 10:31
从使用次数很容易能看出 claude sonnet 4是编程第一。 至于K2我倒感觉真的很一般般,花了大半年终于追上v3, ...

claude家的代码库数据比GitHub还多几倍,国内应该是没有那么高质量的数据
k2 就是生成token速度太慢了,其实真没什么大毛病
没什么黑不黑,好用就用,不好用就不用,靠吹的都会被打回原型
flash在榜3就说明了这个榜的含金量
hk640509
9 小时前
flash 是用来做 edit ,摘要,repo-map 综合速度,价格,上下文,flash在这个生态位近乎于无敌 而不是说它有多智能.无论我的主模型用什么,我的次模型必然是flash.[attachimg]1954[/attachimg]  详情 回复
嚼嚼,之前不是不少人说OR是野榜
不能反馈出deepseek很多人使用的事实
kallen007 发表于 2025-7-22 10:32
flash在榜3就说明了这个榜的含金量

flash 是用来做 edit ,摘要,repo-map
综合速度,价格,上下文,flash在这个生态位近乎于无敌
而不是说它有多智能.
无论我的主模型用什么,我的次模型必然是flash.
1216f2b983b463db1911b19672a065ce5b816552.webp

不看好kimi
您需要登录后才可以回帖 立即登录
高级模式