发帖
 找回密码
 立即注册
搜索
0 0 0
前沿情报 393 0 昨天 10:02

Qwen 隆重推出 Qwen3-LiveTranslate-Flash — 实时多模态传译 — 所见、所闻、所言,即时传译!

核心亮点:

多语言和方言:支持中文、英文、法语、德语、俄语、意大利语、西班牙语、葡萄牙语、日语、韩语、印尼语、泰语、越南语、阿拉伯语、印地语、希腊语、土耳其语等主要官方语言和普通话、粤语、北京话、吴话、四川话、天津话的方言翻译。
视觉增强理解:引入视觉上下文增强技术,通过识别和利用口型、动作、文字、实体等多模态信息,有效应对嘈杂音频环境以及一词多译词场景下的翻译不准问题。
3秒延迟:轻量的混合专家架构与动态采样策略实现最低3秒延迟的同传体验。
无损同传:采用语义单元预测技术缓解跨语言翻译的调序问题,实现与离线翻译几乎无损的翻译质量。
音色自然:海量语音数据训练,可以根据原始语音内容自适应调节语气和表现力的拟人音色。

模型性能:

在公开测试集上中英及多语言语音翻译:
f42334cf60c8feea579c03287d8ffbcd2ad3f50c.jpeg
在不同领域和复杂声学环境下:
fa034f84424a12dbcd56910f4c2f736a13b50127.jpeg
在实时场景中:
de82073c110e7d259fb4ddf06e2f009d284bedd7.jpeg

博客:https://qwen.ai/blog?id=4266edf7f3718f2d3fda098b3f4c48f3573215d0&from=home.latest-research-list

Dashscope:https://www.alibabacloud.com/help/en/model-studio/qwen3-livetranslate-flash-realtime

演示:https://huggingface.co/spaces/Qwen/Qwen3-Livetranslate-Demo

转载来源:https://x.com/Alibaba_Qwen/status/1970565641594867973

──── 0人觉得很赞 ────

使用道具 举报

这个啊
Qwen 隆重推出 Qwen3LiveTranslateFlash——实时多模态传译。所见、所闻、所言,即时传译!
效果还挺好的,就是不知道上线之后费用如何。能实现低延迟的实时语音转文字翻译,应用场景也挺多的。  
好厉害୧(๑•̀◡•́๑)૭
可以啊!
在发送的DEMO里实际体验后,发现延迟比他所说的要大很多。

正常情况下,不同语种之间的翻译,由于存在语序差异(比如汉语是SVO语序,日语是SOV语序),通常都要等句子说完,才能理解意思并进行准确翻译,有些情况还需要结合上下文。
3秒延迟:采用轻量的混合专家架构与动态采样策略,实现最低3秒延迟的同传体验。
您需要登录后才可以回帖 立即登录
高级模式