IndexTTS2 实现零样本语音克隆:精准控制+情感解耦
IndexTTS2 是一个突破性的自回归语音合成模型,能在零样本条件下实现两大核心能力:精确的时长控制,以及音色与情感的完美解耦。该模型支持包括愤怒、哭泣、恐惧、沮丧、快乐、惊讶、平静等在内的丰富情感表达。
不过目前官方只放出了演示网站和一些对比音频,期待后续能放出完整模型和代码。
https://index-tts.github.io/index-tts2.github.io/
NSFW Grok 推出数字伙伴
马斯克发文表示 Grok 1.1.17 版本带来了 Companions(数字伙伴)功能。更新后,用户只需在设置中向下滚动至语音部分,点击「启用伙伴」即可开启,需要 SuperGrok 订阅。
我只能说,有好感度系统,高了可以涩涩,这下赢麻了。
https://x.com/elonmusk/status/1944705383874146513