发帖
 找回密码
 立即注册
搜索
0 0 0
日常闲聊 463 0 9 小时前
作为一个喜欢动手折腾的技术爱好者,我总想搞清楚各种模型到底是怎么工作的。现在市面上有这么多的“ lightning模型”,我干脆做了一个视觉对比,看看它们的输出到底有什么不同。我用了7个不同的模型,分成5步和4步的流程,在3种不同的提示下跑了一遍,想看看哪些模型表现突出,哪些可能适合搭配使用。
  
演示顺序如下:  
  
  • x2v lightning for 2.1 (T2V)
  • x2v lightning for 2.1 (I2V)*
  • x2v lightning for 2.2 (T2V)
  • Kijai's lightning for 2.2 (T2V)
  • vrgamedevgirl's FusionX for 2.1
  • FastWan rank 64 for 2.1
  • CausVid rank 32 for 2.1

我把这个I2V模型也加了进来,虽然它有时候会出现一些伪影或者动作不稳定,但它在画面感觉和主体稳定性方面还是有一定价值的。
  
根据这次实验和其他一些测试,我总结了一些个人感受:
  
单独使用的话,x2v lightning T2V 2.1仍然是我的首选。
lightning在镜头控制和动作连贯性方面表现不错,但有时候会有点“死板”,限制了创造力。
两个2.2版本的 模lightning型在荧光灯环境下会让画面显得有点“发白”或“洗掉”了细节。
FuxionX的表现很有活力,让我印象深刻。
FastWan在柔和的光线和雾气效果上表现得更好。
CausVid有个小毛病,就是在前几帧画面里经常“留疤”——有点像残留的痕迹。
  
我整理了一个压缩包,里面包含了对比视频和三个主题视频,展示了整个流程是怎么跑的。你可以通过这个链接下载:



──── 0人觉得很赞 ────

使用道具 举报

我实在忍不住想更新一下,我决定亲自测试一下这个方法,结果发现效果还挺接近预期的。虽然不是完全准确,但已经非常接近了。不过现在还在纠结,这样做到底有什么好处和坏处,暂时还没想明白
哈哈,听到这个我可太开心了。现在2.2的Loras简直没法看,真心希望他们能快点更新。
总有些东西是说不清的……那个穿红裙子的女人用x2v v11 2.2的闪电模型,出来的效果却像是2.1的模型(权重1)时间戳1分42秒的那个女人,应该就是这个视频:  
https://drive.google.com/file/d/1jnYl9i0SFcEDvQkHhxI77qz1ViysMtUo/view?usp=分享
这也太赞了吧!感谢分享啊!
有些劳拉(LoRA)模型是有不同等级版本的,你可以根据需要来选择。比如,x2v_lightning_T2V这个模型,就提供了16、32、64、128 和 256 这几个等级。在更高等级下,它们会呈现出不同的效果优势,但我对背后的数学原理还不太清楚。而且,关于这些等级的制作方式,以及不同等级能带来什么提升,可能还有更多值得研究的地方。目前我也不确定,使用高等级模型,和通过提升中低等级模型的权重之间,到底有没有足够明显的优势区别。
Kijai做了一个参考网格,用来展示lightx2v这个LoRA模型在不同等级下的效果差异。我自己试下来,感觉64等级的版本最适合我做图像转视频(I2V)。如果是文本转视频(T2V)的话,我一般会用32等级的版本。
好像还有更多可以探索的,我是说更多的变量,比如 cfg 啊、加速 loras 啊,或者是不同调度器的组合之类的。谢谢你做这些测试,这些真的很重要。
您需要登录后才可以回帖 立即登录
高级模式