自从 GPT5 发布以来,网络上简直吵翻天了。很多人讨论的点好像有点跑偏,他们更多是在为旧版本的下线感到不满,而不是真的在评判 GPT5 本身到底好不好用。感觉这些声音把整个讨论空间都占满了。
首先我得说,OpenAI 这次确实有点翻车。不是因为 GPT5 本身不行,而是他们在用户体验这块做得太差了——突然就下线一堆旧功能,连个提示都没有。用户想要的是升级到 5,同时还能继续用旧版,直到自己准备好了再切换。这次更新确实有点草率,这部分我完全同意。他们确实搞砸了,不过好消息是已经在修复了。比如总查询次数的问题,现在也恢复到一个还算合理水平(每周3k次)。所以虽然开头翻车了,但恢复得也还算快。
不过话说回来,模型本身其实被喷得有点冤。我觉得很多负面评价并不公平。我自己试下来,GPT5 其实是一个非常强的模型,几乎所有我用过的场景都表现得很好。它的表现比 GPT4o 更稳定,而且说实话,4o 对我来说几乎没什么好用的场景。GPT5 的 Auto 级别在大多数情况下表现和 o4mini 差不多,而 o4mini 是我之前几乎一直在用的主力模型。至于 GPT5 的 Thinking 级别,它的表现至少不输 o3,而且价格更便宜、速度也更快。
举个例子:我其实不太关心它能不能数清楚字母,因为那本来就不是 AI 的强项。我更关心的是它能不能准确总结文本、能不能有效检查错误或代码。从目前的使用来看,GPT5 出现幻觉的情况比 o4minihigh 还要少一些,写代码也稍微靠谱点。
当然,肯定也有它不擅长的用例,但有些人说它“很烂”,我觉得有点夸张了。我相信随着时间推移,OpenAI 也会不断优化和改进这些模型。
|