兄弟们感觉图片生成 豆包、谷歌Imagen 4、flux等这些那个生图质量好?
兄弟们,感觉图片生成这块,豆包、谷歌Imagen 4、flux这些,哪个生图质量好啊?怎么辨别呢 Imagen 4是最好的,不过指令遵循方面还得看gptimage 体感上Imagen4 >= 豆包 > flux 好,这是个模糊的形容,这些模型都有各自擅长的领域。
真实质感方面,Imagen 第一;
图像美学方面,豆包第一;
对于复杂自然语言理解,GPT 第一;
Flux 是开源的,经过 dev 微调后在 nsfw 方面表现最佳。
以上说的是生图情况。
改图的时候,特别考验语义理解的情况下,GPT 还是非常厉害的,不过很多时候它虽然理解了要求,但画得不对(局部更改会导致全局变动)。Flux Kontext 的改图能力也很强,很多时候交付的效果不比 GPT 差,甚至更好。豆包稍弱一些,但基本也能满足使用需求。其他改图模型的质量就出现了断崖式下跌,谷歌和其他几家的模型就只能当作娱乐,完全无法在实际中使用。 我觉得豆包最厉害的地方在于能生成仿真图片(就像那种不太专业的自拍,有聚焦模糊之类的情况) 索拉最强 只说生成图片这方面的话,感觉豆包是最容易沟通的,生成出来的图片也比较好看。而Imagen 4呢,我感觉有时候它不太能理解我的意思。 即梦还挺实用的,越来越好了 那豆包也挺厉害的 我也觉得头像好看 最好的是gptimage1high,其次是qwenimage,它们分别是闭源领域和开源领域里最好的
页:
[1]