VibeVoice简直太棒了（第一次体验，还没去摘樱桃呢）

日常闲聊 · 2025-8-29 09:47:38

老哥做的包装器装上了 VibeVoice，
工作流是模块文件夹里的“多语音示例”。
我让 GPT 在三个人之间编了个日常对话，
用了三个 1 分钟的音频样本，单声道、44KHz 的 .wav 文件，
模型选的是 7B 的。
我这块 3060 显卡差点没扛住，跑了 54 分钟，
但居然没爆显存（OOM），真是顽强的小姑娘，结果出乎意料的好。
这是第一次尝试，没剪辑、没重来，
我挺震惊的。

猪头他爸 · 2025-8-29 09:55:19

如果你不介意我问一句，跑得还快吗？你用的是什么 GPU 啊？

灰山子 · 2025-8-29 09:56:16

我连 FA 都没装。

kl2272 · 2025-8-29 09:57:18

哈哈，我也想知道。我看到有人在显存比较小的情况下也搞定了，所以应该没问题吧。看来我得等等 FP8 或者 GGUF 这些方案了。

wangqua8 · 2025-8-29 10:08:17

我真是挺佩服用3060跑高端模型的耐心，虽然中间肯定少不了各种折腾和等待。

H_VW23D · 2025-8-29 10:20:17

我连它怎么运行的都不知道，我只是按了 Alt+Tab 就去干别的事了。

pasu · 2025-8-29 12:07:17

这个节点可以切换注意力机制，让你跳过 flash，改用 sdpa
https://github.com/wildminder/comfyuivibevoice

tszqc · 2025-8-29 15:17:39

放松点，兄弟们...

灰黑猫儿 · 7 天前

我觉得希格斯也挺好，而且更快~

big132580 · 5 天前

我只是给别人一个头（可能是指分享了一个方法或配置），结果尝试使用希格斯（Higgs？可能是某个项目或工具名）破坏了我的环境（ENV），尤其是跟 insightface 有关的部分。
同时还搞崩了 Chatterbox，引发了一堆和 protobuf 相关的问题。
可能是我自己的操作问题，但最后我只能在尝试修复失败后，把整个 Python 的嵌入文件夹给回滚了。

SOLDIER · 5 天前

我看到你提到7b模型用了大量的显存，但从你描述的情况来看，GPU利用率只从35%加载到了45%，有没有做啥优化来充分榨干显卡的性能呢？

Sswfive · 前天 05:21

你是不是也觉得，咱们每天在新闻里看特朗普都看腻了？赶紧滚吧，这堆破事儿。

ttitp · 前天 06:53

当然可以，我就是技术控+AI爱好者一枚，平时就喜欢用大伙儿都懂的“人话”聊技术，咱就这么熟络地唠起来：嘿，没问题啊兄弟！咱这就开聊～

暮色回响 · 昨天 05:15

你是在 Windows 上运行这个吗？

zhaoxiaoning · 昨天 05:49

他的宝可梦收藏真是让我大开眼界

		自动登录	找回密码
密码			立即注册

交流VibeVoice简直太棒了（第一次体验，还没去摘樱桃呢）

相关帖子

10 回复

浏览过的版块