发帖
 找回密码
 立即注册
搜索
0 0 0
日常闲聊 541 0 2025-8-29 09:47:38
老哥做的包装器装上了 VibeVoice,  
工作流是模块文件夹里的“多语音示例”。  
我让 GPT 在三个人之间编了个日常对话,  
用了三个 1 分钟的音频样本,单声道、44KHz 的 .wav 文件,  
模型选的是 7B 的。  
我这块 3060 显卡差点没扛住,跑了 54 分钟,  
但居然没爆显存(OOM),真是顽强的小姑娘,结果出乎意料的好。  
这是第一次尝试,没剪辑、没重来,  
我挺震惊的。
──── 0人觉得很赞 ────

使用道具 举报

2025-8-29 09:55:19
如果你不介意我问一句,跑得还快吗?你用的是什么 GPU 啊?
2025-8-29 09:56:16
我连 FA 都没装。
2025-8-29 09:57:18
哈哈,我也想知道。我看到有人在显存比较小的情况下也搞定了,所以应该没问题吧。看来我得等等 FP8 或者 GGUF 这些方案了。
2025-8-29 10:08:17
我真是挺佩服用3060跑高端模型的耐心,虽然中间肯定少不了各种折腾和等待。
2025-8-29 10:20:17
我连它怎么运行的都不知道,我只是按了 Alt+Tab 就去干别的事了。
2025-8-29 12:07:17
这个节点可以切换注意力机制,让你跳过 flash,改用 sdpa  
https://github.com/wildminder/comfyuivibevoice
2025-8-29 15:17:39
放松点,兄弟们...
我觉得希格斯也挺好,而且更快~
我只是给别人一个头(可能是指分享了一个方法或配置),结果尝试使用希格斯(Higgs?可能是某个项目或工具名)破坏了我的环境(ENV),尤其是跟 insightface 有关的部分。  
同时还搞崩了 Chatterbox,引发了一堆和 protobuf 相关的问题。  
可能是我自己的操作问题,但最后我只能在尝试修复失败后,把整个 Python 的嵌入文件夹给回滚了。
我看到你提到7b模型用了大量的显存,但从你描述的情况来看,GPU利用率只从35%加载到了45%,有没有做啥优化来充分榨干显卡的性能呢?
你是不是也觉得,咱们每天在新闻里看特朗普都看腻了?赶紧滚吧,这堆破事儿。
当然可以,我就是技术控+AI爱好者一枚,平时就喜欢用大伙儿都懂的“人话”聊技术,咱就这么熟络地唠起来:嘿,没问题啊兄弟!咱这就开聊~
你是在 Windows 上运行这个吗?
他的宝可梦收藏真是让我大开眼界
您需要登录后才可以回帖 立即登录
高级模式