发帖
 找回密码
 立即注册
搜索
0 0 0
快问快答 943 0 2025-8-27 17:00:32
最近迷上了openwebui的语音模式,文本转语音用的minimax的逆向,还不错,就是这个语音转文本用的硅基流动免费的FunAudioLLM/SenseVoiceSmall,但是遇到一些专业的词语就识别错误了,有没有什么好用的语音转文本模型推荐…本来想用豆包和阿里的,但是字节跳动和阿里云均要满18。。。然后OPENAI的那个,经常把中文识别成英文
──── 0人觉得很赞 ────

使用道具 举报

2025-8-27 17:54:37
我用过的比较不错的中文模型就是阿里的那个。

然后听说elevenlabs的也还行。

实在不行的话,你直接用gemini2.5pro的多模态,那个效果应该是最好的,写个脚本批量处理就行。
2025-8-27 19:37:35
不知道你用的是不是 Mac 电脑,要是 Mac 的话,给你推荐这个开源项目。
2025-8-28 12:47:04
看来是没有了,悲哀啊
2025-8-28 13:42:03
阿里和豆包的开源情况都还不错。
2025-8-28 17:12:04
这个就是个单纯的APP吧,我想要那种遵循OpenAI API规范的语音转文本模型……
2025-8-29 08:25:23
这个家伙试过吗
https://tingwu.aliyun.com/helpcenter/api
我觉得还挺好的
2025-8-29 09:57:22
飞书妙记,我一直在用
也可以有 API 的
捉文文~~
试试groq的
未成年好难选模型呀
主要是想要 API,因为我把 openwebui 部署在服务器上面了。
您需要登录后才可以回帖 立即登录
高级模式