求语音转文本模型推荐_快问快答_BigSeek AI社区

寂寞狼 发表于昨天 17:00

求语音转文本模型推荐

最近迷上了openwebui的语音模式，文本转语音用的minimax的逆向，还不错，就是这个语音转文本用的硅基流动免费的FunAudioLLM/SenseVoiceSmall，但是遇到一些专业的词语就识别错误了，有没有什么好用的语音转文本模型推荐…本来想用豆包和阿里的，但是字节跳动和阿里云均要满18。。。然后OPENAI的那个，经常把中文识别成英文

tccrock 发表于昨天 17:54

我用过的比较不错的中文模型就是阿里的那个。

然后听说elevenlabs的也还行。

实在不行的话，你直接用gemini2.5pro的多模态，那个效果应该是最好的，写个脚本批量处理就行。

暗果发表于昨天 19:37

不知道你用的是不是 Mac 电脑，要是 Mac 的话，给你推荐这个开源项目。

红光儿 发表于 4 小时前

看来是没有了，悲哀啊

茫茫雨 发表于 3 小时前

阿里和豆包的开源情况都还不错。

页: [1]

BigSeek_AI社区_AI论坛's Archiver

求语音转文本模型推荐