发帖
 找回密码
 立即注册
搜索
5 0 0
前沿情报 32 5 5 小时前

通义万相(Qwen-Image)——一款用于下一代文生图的 200 亿参数 MMDiT 模型。它在创建带有原生文本的精美海报方面表现尤为出色。现已开源。 !

https://huggingface.co/Qwen/Qwen-Image

08155610bd660e14371a7e97665fe45c023e882e.jpeg

──── 0人觉得很赞 ────

使用道具 举报

5 小时前
已经可以稳定地写书法了吗?看来是我太落伍了,我对文生图的认知还停留在中文生成乱成一团的阶段。
阿里还是太迅速了
Qwen 发模型发布数量也太离谱了吧

看起来特性是强大的英文图文混排能力

759ea894a89c5772e31c9c788ead2ad9623dbb0c.jpeg

确实年初开始就有很多文生图模型以图文混排作为特性,但效果还ok的没几个吧。gpt-image和即梦这些已有的one-shot模型,只要遇到不同字体的混排 质量就大幅下降了
您需要登录后才可以回帖 立即登录
高级模式