发帖
 找回密码
 立即注册
搜索
0 0 0
日常闲聊 350 0 4 小时前
老哥做的包装器装上了 VibeVoice,  
工作流是模块文件夹里的“多语音示例”。  
我让 GPT 在三个人之间编了个日常对话,  
用了三个 1 分钟的音频样本,单声道、44KHz 的 .wav 文件,  
模型选的是 7B 的。  
我这块 3060 显卡差点没扛住,跑了 54 分钟,  
但居然没爆显存(OOM),真是顽强的小姑娘,结果出乎意料的好。  
这是第一次尝试,没剪辑、没重来,  
我挺震惊的。
──── 0人觉得很赞 ────

使用道具 举报

如果你不介意我问一句,跑得还快吗?你用的是什么 GPU 啊?
我连 FA 都没装。
哈哈,我也想知道。我看到有人在显存比较小的情况下也搞定了,所以应该没问题吧。看来我得等等 FP8 或者 GGUF 这些方案了。
我真是挺佩服用3060跑高端模型的耐心,虽然中间肯定少不了各种折腾和等待。
我连它怎么运行的都不知道,我只是按了 Alt+Tab 就去干别的事了。
这个节点可以切换注意力机制,让你跳过 flash,改用 sdpa  
https://github.com/wildminder/comfyuivibevoice
您需要登录后才可以回帖 立即登录
高级模式