250701 AI日报:百度开放 Ernie 4.5 大模型;阿里通义 Qwen-TTS 发布
百度开放23款大模型:Ernie 4.5性能比肩OpenAI O1Ernie 4.5重磅发布 23 款开放权重大模型,包括 VLM 和 LLM 两大系列。从官方数据显示,LLM版本超越DeepSeek v3和Qwen 235B,而VLM版本则可与OpenAI O1相媲美。所有模型均基于Apache 2.0许可,完全开放商业用途。此次发布的模型参数范围从0.3B到424B不等,覆盖了各种应用场景需求。可以在在Hugging Face下载这些模型。先不谈模型性能,这还是我认识的百度吗
字节跳动 XVerse 开源:多主体身份一致图像生成模型
字节跳动最新开源XVerse 模型,实现了多主体图像生成中身份一致性。该模型不仅能保持多个角色身份特征稳定,还支持高度自定义的姿势、风格和灯光调节。目前代码和模型已经开源,可以在 github 上查看
阿里通义 Qwen-TTS 发布:支持 3 种中文方言 + 7 种双语发音
阿里通义最新发布 Qwen-TTS 语音合成模型,目前支持三种特色中文方言:北京话、上海话和四川话。更提供 7 种专业级双语发音人声:Cherry、Ethan、Chelsie、Serena、Dylan、Jada 和 Sunny。不过略显遗憾的是,官方暂时没有开源计划,开发者需要通过 API 进行调用,具体接口文档和计费标准可以参考阿里云官方说明。
怎么个事儿,我看看怎么个事儿?
https://www.thepaper.cn/newsDetail_forward_28011217
开源利好全行业 有没有评测一下百度这个模型到底真实情况怎么样? 感觉现在各家都在刷分 分数已经有点脱离实际体验了 已阅已阅 xverse这名起的好奇怪,像看片网站 什么?百度舍得开源?今儿太阳打哪边升起的? peterll 发表于 2025-7-1 10:46
怎么个事儿,我看看怎么个事儿?
https://www.thepaper.cn/newsDetail_forward_28011217
马上把你百度号封了! 大厂模型各放大招啦
页:
[1]