登录发现更多内容
首页
板块
ai工具
导读
发帖
用户名
Email
自动登录
找回密码
密码
登录
立即注册
登录
立即登录
立即注册
微信登陆
首页
版块
BBS
导读
勋章
任务
发帖
搜索
搜索
热搜:
活动
交友
discuz
本版
文章
帖子
用户
收藏
道具
勋章
任务
门户
导读
排行榜
设置
我的收藏
退出
0
0
0
首页
快问快答
›
求语音转文本模型推荐
返回列表
提问
求语音转文本模型推荐
[ 复制链接 ]
寂寞狼
UID:299
萌新
发布新帖
快问快答
913
0
昨天 17:00
最近迷上了openwebui的语音模式,文本转语音用的minimax的逆向,还不错,就是这个语音转文本用的硅基流动免费的FunAudioLLM/SenseVoiceSmall,但是遇到一些专业的词语就识别错误了,有没有什么好用的语音转文本模型推荐…本来想用豆包和阿里的,但是字节跳动和阿里云均要满18。。。然后OPENAI的那个,经常把中文识别成英文
语音转文本
app
点赞
0
收藏
0
────
0
人觉得很赞
────
相关帖子
根据文本提示生成图像在线运行app
回复
使用道具
举报
4 回复
tccrock
回复
使用道具
举报
昨天 17:54
我用过的比较不错的中文模型就是阿里的那个。
然后听说elevenlabs的也还行。
实在不行的话,你直接用gemini2.5pro的多模态,那个效果应该是最好的,写个脚本批量处理就行。
回复
点赞
评论
使用道具
举报
暗果
回复
使用道具
举报
昨天 19:37
不知道你用的是不是 Mac 电脑,要是 Mac 的话,给你推荐这个开源项目。
回复
点赞
评论
使用道具
举报
红光儿
回复
使用道具
举报
4 小时前
看来是没有了,悲哀啊
回复
点赞
评论
使用道具
举报
茫茫雨
回复
使用道具
举报
3 小时前
阿里和豆包的开源情况都还不错。
回复
点赞
评论
使用道具
举报
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
立即登录
微信登陆
点评
高级模式
本版积分规则
回帖后跳转到最后一页
浏览过的版块
前沿情报
日常闲聊
最新回复
1
神人谷歌,Gemini 2.5 Flash Image Preview 改一个单词就绕过了
2
google香蕉的图片审核真是十分夸张
3
Vibe Coding 小红书解析+AI投流建议
4
gemini-2.5-flash-image-preview 吓死我力
5
🍌小香蕉真的太强了!
6
Make Google Great Again !!!
7
离谱, banana以一己之力, 让openrouter支持生图模式了.
8
banana那么强, 会不会把整个设计行业给颠覆掉?
推荐版块
日常闲聊
资源分享
快问快答
教程文档
福利活动
统计信息
会员数: 1212 个
话题数: 11139 篇
巅峰数: 144 人
首页
板块
AI工具
导读
我的