国内的模型是否有点跑分特化
看着分数挺高,但是实际上用起来差强人意 https://linux.do/images/emoji/twemoji/downcast_face_with_sweat.png?v=14得看是什么模型吧 不能代表全部,国外也有llma4这种 大家都有在刷分其实,其实公众不用太关心分数了,自己觉得哪个好用就用哪个,分不分的其实对日常使用影响不大 过拟合嘛,这世上有哪个模型没有干这种事情的? https://linux.do/uploads/default/original/3X/2/4/2474aff38580dda1677bc9472dadc96d02ef55d3.png?v=14
高分低能是吧?
不过现在国产模型里面跑分不错的好像就豆包、DeepSeek 了。
剩下那些确实已经不关注、不用了。
感觉大模型 6 小龙难了。 国内外模型都有点,不过我更喜欢不那么敏感的 能跑分 就肯定会有专门的跑分模式,跟手机跑分其实一个德行,当年手机跑分火的时候不也这样吗,分是高的很,用起来稀碎 johnwar 发表于 2025-6-19 09:45
能跑分 就肯定会有专门的跑分模式,跟手机跑分其实一个德行,当年手机跑分火的时候不也这样吗,分是高的很 ...
猴王:你报我身份证得了
页:
[1]