通义万相（Qwen-Image）一款用于下一代文生图的 200 亿参数 MMDiT 模型发布_前沿情报_BigSeek AI社区

leonx-iii 发表于 2025-8-5 17:52:17

通义万相（Qwen-Image）一款用于下一代文生图的 200 亿参数 MMDiT 模型发布

通义万相（Qwen-Image）——一款用于下一代文生图的 200 亿参数 MMDiT 模型。它在创建带有原生文本的精美海报方面表现尤为出色。现已开源。 !
https://huggingface.co/Qwen/Qwen-Image
<img src="data/attachment/forum/202508/05/175212m2lrhms1lhmljd4r.jpeg" alt="08155610bd660e14371a7e97665fe45c023e882e.jpeg" title="08155610bd660e14371a7e97665fe45c023e882e.jpeg" />

leonx-iii 发表于 2025-8-5 17:52:57

已经可以稳定地写书法了吗？看来是我太落伍了，我对文生图的认知还停留在中文生成乱成一团的阶段。

magic886 发表于 2025-8-5 17:53:07

阿里还是太迅速了

ss20052008 发表于 2025-8-5 17:53:16

Qwen 发模型发布数量也太离谱了吧

lwflove1999 发表于 2025-8-5 17:53:40

看起来特性是强大的中英文图文混排能力
<img src="data/attachment/forum/202508/05/175338wtrik1wwkzqqw99t.jpeg" alt="759ea894a89c5772e31c9c788ead2ad9623dbb0c.jpeg" title="759ea894a89c5772e31c9c788ead2ad9623dbb0c.jpeg" />

hython 发表于 2025-8-5 17:54:25

确实年初开始就有很多文生图模型以图文混排作为特性，但效果还ok的没几个吧。gpt-image和即梦这些已有的one-shot模型，只要遇到不同字体的混排质量就大幅下降了

xchenxjiex 发表于 2025-8-22 12:00:04

这模型开源啦？

页: [1]

BigSeek_AI社区_AI论坛's Archiver

通义万相（Qwen-Image） 一款用于下一代文生图的 200 亿参数 MMDiT 模型发布

通义万相（Qwen-Image）一款用于下一代文生图的 200 亿参数 MMDiT 模型发布