发帖
 找回密码
 立即注册
搜索
3 0 0
日常闲聊 758 3 4 小时前
今天上线了一个非常不错的 WAN 2.2 T2I 修改版模型(不是我做的哈),用来生成高质量图像。我用 RES4LYF 搭了一个结构比较简单的工作流,效果还不错。
模型地址:https://civitai.com/models/1927692  
工作流地址:https://civitai.com/models/1931055  
简单说下这个模型的背景:  
它是从 Wan2.2 T2V14B 文生视频模型演化来的,做了混合和精细化处理。目的是让喜欢 Wan 2.2 的用户也能方便地生成各种风格的图像,有点像用 Flux 模型那样。
这个模型在生成真实感图像方面表现不错,同时也能应对多种风格需求。不过因为是从视频模型改来的,所以在纯图像生成方面稍微弱一点点。整体来看,它在真实感和风格多样性之间做了个平衡,细节方面也做了加强,可以说跟 Flux.1Dev 的创造力和表现力差不多。
技术上,这个模型是把 Wan2.2T2V14B 的高噪声和低噪声部分分层,然后用不同权重混合,再做了一点微调。目前它还是实验性质的,可能还有些小问题,欢迎大家试试看,也欢迎提反馈,方便后续版本优化改进。
──── 0人觉得很赞 ────

使用道具 举报

谢谢你的分享!你可能需要检查一下编辑工作流的链接,现在它跳转到你的画廊页面,而不是工作流的主页。我猜应该是不小心弄错了,不是故意的吧。另外,我还注意到你引用了FP8模型的链接,但实际工作流里用的是UNET版本。我琢磨了一会儿才反应过来,可能其他人也会在这里卡一下。总之,感谢分享,只是提个小建议,方便后面的人参考~
给它一个机会,试试看呗!
它是怎么做到忠实还原Loras的风格的呢?我之前用Wan 2.2做文本到图像(t2i)的时候,总是跟Loras有点出入。但这次文本到视频(t2v)的效果看起来挺不错的。  
而且,如果只是用低噪声模型做t2i的话,效果反而更差。
说到LoRAs,你可一定要试试看!
这些照片仿佛在大喊:“美国那些名字里没有字母O的城市……你敢信?”
谢谢你!我来试试看。之前我一直用 wan 2.2 做 t2v 生成 t2i,现在我的 GPU 肯定要开心了!
您需要登录后才可以回帖 立即登录
高级模式