在过去的一年里,我一直在使用Claude,无论是处理日常任务还是针对代码相关的问题(通过应用程序以及Cline)。显然,大型语言模型(LLMs)要能够处理大规模/复杂的代码库,我们还有很长的路要走,但与其他所有闭源大型语言模型相比,Anthropic的表现似乎非常出色。话虽如此,我很想更深入地了解目前用于编码的开源大型语言模型的现状。
我有几个问题希望能得到解答……
为什么像Claude或Gemini这样的闭源大型语言模型在性能上明显优于像通义千问代码助手(Qwen Coder)这样的开源大型语言模型呢?是因为这些公司拥有资源(资金雄厚且有优秀的员工)这么简单的原因吗?
有没有值得关注的开源大型语言模型开发者呢?就像我之前说的,我用过一点通义千问,它挺不错的,但显然不如Claude。除此之外,我只是根据Reddit上的搜索结果下载了几个(开源模型)。
说一下背景情况,我用的是配备48GB内存的苹果M4 Pro笔记本电脑……所以不算最好,也不算最差。
谢谢大家!
|