通义万相(Qwen-Image) 一款用于下一代文生图的 200 亿参数 MMDiT 模型发布
<p>通义万相(Qwen-Image)——一款用于下一代文生图的 200 亿参数 MMDiT 模型。它在创建带有原生文本的精美海报方面表现尤为出色。现已开源。 !</p><p>https://huggingface.co/Qwen/Qwen-Image</p>
<p><img src="data/attachment/forum/202508/05/175212m2lrhms1lhmljd4r.jpeg" alt="08155610bd660e14371a7e97665fe45c023e882e.jpeg" title="08155610bd660e14371a7e97665fe45c023e882e.jpeg" /></p>
已经可以稳定地写书法了吗?看来是我太落伍了,我对文生图的认知还停留在中文生成乱成一团的阶段。 阿里还是太迅速了 Qwen 发模型发布数量也太离谱了吧 <p>看起来特性是强大的<strong>中</strong>英文图文混排能力</p>
<p><img src="data/attachment/forum/202508/05/175338wtrik1wwkzqqw99t.jpeg" alt="759ea894a89c5772e31c9c788ead2ad9623dbb0c.jpeg" title="759ea894a89c5772e31c9c788ead2ad9623dbb0c.jpeg" /></p>
确实年初开始就有很多文生图模型以图文混排作为特性,但效果还ok的没几个吧。gpt-image和即梦这些已有的one-shot模型,只要遇到不同字体的混排 质量就大幅下降了 这模型开源啦?
页:
[1]