发帖
 找回密码
 立即注册
搜索
4 0 0
日常闲聊 747 4 4 小时前
我对腾讯新推出的  SRPO  模式挺感兴趣的,所以就想着做个简单的对比测试,看看它跟原本的通量模型(flux)叠加起来效果咋样。
  
没看过SRPO的朋友可能会问,这到底是个啥?
  
简单来说,SRPO(语义相对偏好优化)是一种新的微调方法,目的是让文本生成图像的模型更贴近人类的喜好。说白了,就是让AI画图更懂你想要啥,生成的图片更符合你的预期。这种方法更聪明,能直接利用提示词本身来引导生成过程,减少了对额外奖励模型的依赖,效率也更高。如果你感兴趣,可以去他们的 [Hugging Face 页面](https://huggingface.co/tencent/SRPO) 看详细资料。
  
我是怎么测试的:
  
我的测试方法挺直接的:
  
我从 Civitai 上找了一些用基础 “flux Dev” 模型生成的高质量示例图
  
然后我直接复制了原作者使用的  完整提示词
  
接着我用的是  原始的 SRPO 模型权重(没有加 LoRAs),按照他们在 Hugging Face 页面上推荐的默认流程来生成图片
  
>  左边是我用 SRPO 生成的图 | 右边是 Civitai 上的原图
  
  设置是:Euler 采样器,分辨率 720x1280,50 步,随机种子  
  
实话实说,我觉得 SRPO 调整后的 flux 模型表现真的很不错,特别是它啥额外模型都没加的情况下。提示词理解能力可以说挺强了。
  
当然啦,审美这种东西本来就是仁者见仁,智者见智,所以我还是让你们自己来评判吧~
──── 0人觉得很赞 ────

使用道具 举报

我刚搞到了一块额外的4TB固态硬盘,  
因为实在受不了空间不够用了😭
SRPO模型在处理人体解剖学结构(比如手部)时,通常会结合以下几种关键技术手段:1. 高精度的3D建模:  
   手部结构复杂,包含27块骨头、多个关节和肌腱。  
   SRPO会使用高精度的3D网格模型来准确还原这些结构的空间关系。2. 语义分割与关键点检测:  
   模型会对图像中的手部进行语义分割,识别出不同部分(如手指、掌骨等),  
   并通过关键点检测定位关节位置,便于后续动作分析或姿态估计。3. 物理约束建模:  
   为了模拟真实的人体运动,SRPO会在模型中引入生物力学约束,  
   比如关节活动范围、骨骼之间的连接方式等,让手部动作更自然、符合实际。4. 深度学习与数据驱动:  
   借助大量标注的手部图像和姿态数据进行训练,  
   SRPO可以更好地理解手部在不同角度、姿态下的变化规律。5. 多模态融合(如有):  
   如果是结合了IMU(惯性测量单元)或其他传感器数据,  
   SRPO还可以通过多模态信息融合来提升手部姿态估计的精度。总结来说,SRPO在处理手部解剖结构时,不只是“看”得准,还能“理解”得深,  
结合几何、物理和数据驱动的方法,实现对手部的高精度重建与运动分析。
更方便管理,谢啦!
如果 SRPO 在左边,那 "gawd dawg" 看起来就挺顺眼的
哎呀,只有47场演出啊~
我刚测试了一下……嗯,确实挺好用的,部门那边也没收到什么投诉。跟之前测过的其他 Flux 微调版本不一样,这个不会把 LoRA 本来应该生成的脸搞乱。Q8_0 的测试(链接在我其他帖子上面)……现在量化之后,结果也还算不错。
你指定的那些好东西。
Flux开发版角色LoRAs能和SRPO开箱即用版本一起用吗?
您需要登录后才可以回帖 立即登录
高级模式