发帖
 找回密码
 立即注册
搜索
0 0 0
日常闲聊 588 0 昨天 13:31
不得不承认,闭源的GPT4O图片生成确实挺厉害的。
同一个千问官方提示词,生成图片的中文文字质量都差不多。
第一张是千问生成的,第二张是GPT4O生成的,我反倒觉得GPT4O  Image在细节处理上挺厉害的。
而且文字只要是大字,模型原生是不是中文根本无所谓。只有小字才会出现问题。
最让人遗憾的一点是,GPT4O  Image API的配置参数太少了,参数少就意味着算力不能最大化输出,这点太可惜了。得学学Flux,要是出一个Ultra API版本绝对厉害。


──── 0人觉得很赞 ────

使用道具 举报

GPT4O自己翻译成繁体字了,它可能觉得这样好看?不太懂人工智能的想法。
但价格……
属于臆造文字
最强的难道不是豆包吗
在画图的自回归模型的精确控制方面,肯定比扩散模型做得好。
因为扩散模型的方法是去噪,控制的粒度太粗了。
不过,gptimage1在中文方面不太好。
qwenimage就是豆包的强化版本,我试了下豆包,文字都不完整。
您需要登录后才可以回帖 立即登录
高级模式