发帖
 找回密码
 立即注册
搜索
0 0 0
前沿情报 202 0 4 小时前

基于Llama3 70B和405B后训练的混合推理模型,按官方说主要特色为没有公司强加的伦理道德,在争议话题上的拒绝率要更低,并且角色扮演和创意性写作的表现也更好

HuggingFace:https://huggingface.co/collections/NousResearch/hermes-4-collection-68a731bfd452e20816725728
dfbf390df0ccdfd8053875643d475ebc47a6a82d_2_690x372.png官方对话网页:https://chat.nousresearch.com/login
246f1f71a9575fc055312491d956bf4bb81983b2_2_690x388.jpeg

ba2a9cb752a1f89354f1c3b701467d363cb1c2e5.webp
思考模式下在 RefusalBench 上第一,非思考模式仅次于Grok4
e3953f29729026fda6d02780d5a01808f803229c.webp不过智力跑分和其他开源模型的平均分对比就很会玩

──── 0人觉得很赞 ────

使用道具 举报

不知道其他能力如何,不过我感觉在写作方面,还比不上微软的3B小模型。
还不如我之前在本地部署的Qwen2呢,那还是2.5版本零点几个B的模型
看着不厉害,比不上R1,特色大概就是没有伦理道德方面的限制吧
换句话说,它全是用黄色废料训练出来的?
您需要登录后才可以回帖 立即登录
高级模式