Cursor中Claude-4.0-Sonnet没修好的bug,GPT-5-high长考15分钟修好了(Claude-4.1-opus需要开max模式,太贵用不起)。
GPT-5给人的感觉就是均衡,在智力、精准、低幻觉方面都做到了第一梯队,特别擅长修bug,就是思考比较慢。写代码很简洁,就是有时候过于简洁了,达到了防御性编程的效果。
Claude模型的优点就是写代码非常迅速而优雅,但是在找Bug上有时候明显感到思考深度不够,写代码的时候有过度设计的倾向,特别喜欢用try catch。
至于谷歌的哈基米,我几乎不用,不过哈基米写写文档还是可以的。