VibeVoice简直太棒了（第一次体验，还没去摘樱桃呢）

日常闲聊 · 4 小时前

老哥做的包装器装上了 VibeVoice，
工作流是模块文件夹里的“多语音示例”。
我让 GPT 在三个人之间编了个日常对话，
用了三个 1 分钟的音频样本，单声道、44KHz 的 .wav 文件，
模型选的是 7B 的。
我这块 3060 显卡差点没扛住，跑了 54 分钟，
但居然没爆显存（OOM），真是顽强的小姑娘，结果出乎意料的好。
这是第一次尝试，没剪辑、没重来，
我挺震惊的。

猪头他爸 · 4 小时前

如果你不介意我问一句，跑得还快吗？你用的是什么 GPU 啊？

灰山子 · 4 小时前

我连 FA 都没装。

kl2272 · 4 小时前

哈哈，我也想知道。我看到有人在显存比较小的情况下也搞定了，所以应该没问题吧。看来我得等等 FP8 或者 GGUF 这些方案了。

wangqua8 · 4 小时前

我真是挺佩服用3060跑高端模型的耐心，虽然中间肯定少不了各种折腾和等待。

H_VW23D · 4 小时前

我连它怎么运行的都不知道，我只是按了 Alt+Tab 就去干别的事了。

pasu · 2 小时前

这个节点可以切换注意力机制，让你跳过 flash，改用 sdpa
https://github.com/wildminder/comfyuivibevoice

		自动登录	找回密码
密码			立即注册

交流VibeVoice简直太棒了（第一次体验，还没去摘樱桃呢）

相关帖子