求语音转文本模型推荐

快问快答 · 2025-8-27 17:00:32

最近迷上了openwebui的语音模式，文本转语音用的minimax的逆向，还不错，就是这个语音转文本用的硅基流动免费的FunAudioLLM/SenseVoiceSmall，但是遇到一些专业的词语就识别错误了，有没有什么好用的语音转文本模型推荐…本来想用豆包和阿里的，但是字节跳动和阿里云均要满18。。。然后OPENAI的那个，经常把中文识别成英文

tccrock · 2025-8-27 17:54:37

我用过的比较不错的中文模型就是阿里的那个。

然后听说elevenlabs的也还行。

实在不行的话，你直接用gemini2.5pro的多模态，那个效果应该是最好的，写个脚本批量处理就行。

暗果 · 2025-8-27 19:37:35

不知道你用的是不是 Mac 电脑，要是 Mac 的话，给你推荐这个开源项目。

红光儿 · 2025-8-28 12:47:04

看来是没有了，悲哀啊

茫茫雨 · 2025-8-28 13:42:03

阿里和豆包的开源情况都还不错。

方式 · 2025-8-28 17:12:04

这个就是个单纯的APP吧，我想要那种遵循OpenAI API规范的语音转文本模型……

tzwd873 · 2025-8-29 08:25:23

这个家伙试过吗
https://tingwu.aliyun.com/helpcenter/api
我觉得还挺好的

scrollll · 2025-8-29 09:57:22

飞书妙记，我一直在用

测试 · 6 天前

也可以有 API 的

a.孤独 · 5 天前

捉文文~~

蓝小枫 · 5 天前

试试groq的

wushuhong · 4 天前

未成年好难选模型呀

有块砖头 · 3 天前

主要是想要 API，因为我把 openwebui 部署在服务器上面了。

		自动登录	找回密码
密码			立即注册

提问求语音转文本模型推荐

相关帖子

12 回复

浏览过的版块

元老级人物

第一篇帖

渐入佳境

CV工程师

我是萌新

缝合怪

话痨标兵