发帖
 找回密码
 立即注册
搜索
0 0 0
前沿情报 416 0 昨天 10:38

Qwen3-ASR-Flash:高精度多语言语音识别模型

998c62457294f42b1286410162911a95b62540d6.webp

Qwen3-ASR-Flash 是基于 Qwen3 推出的高精度多语言语音识别模型,支持 11 种语言及其多种口音,具备自动语种检测与非人声过滤功能。

https://qwen.ai/blog?id=824c40353ea019861a636650c948eb8438ea5cf2&from=home.latest-research-list

目前该模型暂未开源(有点小遗憾),但已上线阿里云百炼平台 API,佬们也可以在 Hugging Face Space 上在线体验。

https://huggingface.co/spaces/Qwen/Qwen3-ASR-Demo


哔哩哔哩开源 IndexTTS-2.0:新一代零样本语音合成模型

IndexTTS-2.0 是哔哩哔哩语音团队开源的新一代零样本语音合成模型,基于 55K 小时中英双语语音和 135 小时情感数据训练,实现了对语音时长和情感的精准控制。

目前 SDK 和模型都已开放,有需要可以试试看!

https://github.com/index-tts/index-tts


即梦 AI 推出 Seedream 4.0 图像生成模型

a5b3a11ab45b4cba72e3fc94a44df90d532a59a2.webp

即梦 AI 平台官网的新一代图像生成模型 Seedream 4.0 已逐步向所有用户推送,中国版 Nano Banana 来了。

https://jimeng.jianying.com/ai-tool/home

不过官方尚未发文正式发布,但登录后即可直接体验,一次生成消耗 1 积分。


MCP Registry 发布:开源标准化 MCP 服务器分发与发现

f225163400bda25eca1bb10dd714689fb0272e03.webp

Model Context Protocol(MCP)Registry 预览版正式发布,这个项目可以理解为 Node.js 的 npm 或者 Python 的 PyPI 的 MCP 版本。

https://blog.modelcontextprotocol.io/posts/2025-09-08-mcp-registry-preview/

它旨在标准化 MCP 服务器的分发与发现流程,完全开源并支持下游构建公共或私有的子注册表。目前只能通过接口和命令行工具来发布和获取,感觉可以开始抢占几个好名字了!


Vercel 开源 Vibe Coding Platform:集成 AI SDK 的完整开发生态

Vibe Coding Platform 是 Vercel 发布并开源的基于其公司生态系统(包含 AI SDK、Gateway 和 Sandbox )的编码平台。

https://oss-vibe-coding-platform.vercel.app/

有做类似业务的可以好好研究下源码,学习学习设计思路啥的。

https://github.com/vercel/examples/tree/main/apps/vibe-coding-platform

──── 0人觉得很赞 ────

使用道具 举报

前排看报!
中饭前看报
前来读报
感谢分享
几日不见,甚是想念
前排看报
感谢分享
您需要登录后才可以回帖 立即登录
高级模式