发帖
 找回密码
 立即注册
搜索
6 1 0
日常闲聊 57 6 昨天 18:42
看着分数挺高,但是实际上用起来差强人意
──── 1人觉得很赞 ────

使用道具 举报

得看是什么模型吧
不能代表全部,国外也有llma4这种
大家都有在刷分其实,其实公众不用太关心分数了,自己觉得哪个好用就用哪个,分不分的其实对日常使用影响不大
过拟合嘛,这世上有哪个模型没有干这种事情的?

高分低能是吧?

不过现在国产模型里面跑分不错的好像就豆包、DeepSeek 了。

剩下那些确实已经不关注、不用了。

感觉大模型 6 小龙难了。
国内外模型都有点,不过我更喜欢不那么敏感的
您需要登录后才可以回帖 立即登录
高级模式