leonx-iii 发表于 2025-8-5 17:52:17

通义万相(Qwen-Image) 一款用于下一代文生图的 200 亿参数 MMDiT 模型发布

<p>通义万相(Qwen-Image)——一款用于下一代文生图的 200 亿参数 MMDiT 模型。它在创建带有原生文本的精美海报方面表现尤为出色。现已开源。 !</p>
<p>https://huggingface.co/Qwen/Qwen-Image</p>
<p><img src="data/attachment/forum/202508/05/175212m2lrhms1lhmljd4r.jpeg" alt="08155610bd660e14371a7e97665fe45c023e882e.jpeg" title="08155610bd660e14371a7e97665fe45c023e882e.jpeg" /></p>

leonx-iii 发表于 2025-8-5 17:52:57

已经可以稳定地写书法了吗?看来是我太落伍了,我对文生图的认知还停留在中文生成乱成一团的阶段。

magic886 发表于 2025-8-5 17:53:07

阿里还是太迅速了

ss20052008 发表于 2025-8-5 17:53:16

Qwen 发模型发布数量也太离谱了吧

lwflove1999 发表于 2025-8-5 17:53:40

<p>看起来特性是强大的<strong>中</strong>英文图文混排能力</p>
<p><img src="data/attachment/forum/202508/05/175338wtrik1wwkzqqw99t.jpeg" alt="759ea894a89c5772e31c9c788ead2ad9623dbb0c.jpeg" title="759ea894a89c5772e31c9c788ead2ad9623dbb0c.jpeg" /></p>

hython 发表于 2025-8-5 17:54:25

确实年初开始就有很多文生图模型以图文混排作为特性,但效果还ok的没几个吧。gpt-image和即梦这些已有的one-shot模型,只要遇到不同字体的混排 质量就大幅下降了

xchenxjiex 发表于 2025-8-22 12:00:04

这模型开源啦?
页: [1]
查看完整版本: 通义万相(Qwen-Image) 一款用于下一代文生图的 200 亿参数 MMDiT 模型发布