我现在主要用大语言模型(LLMs)来做第一轮的历史研究,感觉就像有个普通的研究助理在帮我查资料。我用过 ChatGPT、Claude、Perplexity 和 DeepSeek 的付费版本,不过最近我已经退订了 ChatGPT。美国这边的大模型好像正在经历一段“退化期”,主要是因为他们在防止AI胡说八道和打击不良内容方面做得有点过头,结果反而影响到了正常用户的体验。现在这些公司有点迷茫,不知道是该学欧盟那样严格监管,还是像中国、俄罗斯那样自由发展。Grok 我是绝对不会用的。马斯克这个人挺让人反感的,Grok 也一样让人反感。如果说哪个模型能让你得“大脑疱疹”,那一定就是 Grok。Gemini 在人文方面太拉胯了,听说它在写代码方面还不错?目前来看,DeepSeek 给我的回复是最优雅、最完整的。我每隔几周都会做个对比测试,现在 DeepSeek 和 Perplexity 的表现都很不错。特别是在研究模式下,DeepSeek 几乎能跟 Claude Opus 媲美,真的很棒。这个市场变化太快了,说不定哪天某个模型就突然不行了。如果真遇到这种情况,我就换一个模型接着用,挺灵活的。有点讽刺的是,现在中国的大模型反而成了最灵活、最强的,因为监管没那么严。Perplexity 是美国这边唯一一个还能用的,虽然比不上 DeepSeek。当然了,出于一些显而易见的原因,我不会用它来处理什么涉及重要知识产权的内容。但如果是做研究的话,我觉得和它合作还挺愉快的,互惠互利。 |