好,这是个模糊的形容,这些模型都有各自擅长的领域。
真实质感方面,Imagen 第一;
图像美学方面,豆包第一;
对于复杂自然语言理解,GPT 第一;
Flux 是开源的,经过 dev 微调后在 nsfw 方面表现最佳。
以上说的是生图情况。
改图的时候,特别考验语义理解的情况下,GPT 还是非常厉害的,不过很多时候它虽然理解了要求,但画得不对(局部更改会导致全局变动)。Flux Kontext 的改图能力也很强,很多时候交付的效果不比 GPT 差,甚至更好。豆包稍弱一些,但基本也能满足使用需求。其他改图模型的质量就出现了断崖式下跌,谷歌和其他几家的模型就只能当作娱乐,完全无法在实际中使用。 |