通义万相（Qwen-Image）一款用于下一代文生图的 200 亿参数 MMDiT 模型发布

前沿情报 · 2025-8-5 17:52:17

通义万相（Qwen-Image）——一款用于下一代文生图的 200 亿参数 MMDiT 模型。它在创建带有原生文本的精美海报方面表现尤为出色。现已开源。 !

https://huggingface.co/Qwen/Qwen-Image

leonx-iii · 2025-8-5 17:52:57

已经可以稳定地写书法了吗？看来是我太落伍了，我对文生图的认知还停留在中文生成乱成一团的阶段。

magic886 · 2025-8-5 17:53:07

阿里还是太迅速了

ss20052008 · 2025-8-5 17:53:16

Qwen 发模型发布数量也太离谱了吧

lwflove1999 · 2025-8-5 17:53:40

看起来特性是强大的中英文图文混排能力

hython · 2025-8-5 17:54:25

确实年初开始就有很多文生图模型以图文混排作为特性，但效果还ok的没几个吧。gpt-image和即梦这些已有的one-shot模型，只要遇到不同字体的混排质量就大幅下降了

xchenxjiex · 2025-8-22 12:00:04

这模型开源啦？

		自动登录	找回密码
密码			立即注册

新品通义万相（Qwen-Image）一款用于下一代文生图的 200 亿参数 MMDiT 模型发布