阿里 Qwen-Image:20B 参数开源文生图模型,文本渲染能力突出

阿里巴巴通义千问团队发布了其首个图像生成基础模型 Qwen-Image。该模型是一个拥有 20B 参数的 MMDiT 模型,基于 Apache 2.0 许可证开源。
官方号称其特别擅长文本渲染和复杂场景生成。完整介绍可以查看官方博客。
https://qwenlm.github.io/zh/blog/qwen-image/
腾讯混元开源 0.5B-7B 轻量级大模型系列

腾讯混元团队一次性开源了四款参数规模从 0.5B 到 7B 的小尺寸大语言模型。
https://x.com/TencentHunyuan/status/1952262079051940322
这些模型专门针对消费级 GPU、边缘计算设备(包括智能汽车、智能家居)以及移动终端(手机和 PC)等低功耗场景优化设计。
XAI 发布 Grok Imagine 4:支持文生图/视频及 NSFW 内容生成
马斯克旗下 XAI 推出的 Grok Imagine 4 现已正式发布。
该功能支持文生图,生成速度极快,就跟刷小红书似的。还支持图生视频,不过效果一般,但生成效率同样出色,最 6 的是原生支持 NSFW 内容生成。
目前已经向所有 Premium 订阅用户开放,需将客户端更新至最新版本才能体验。
https://x.com/elonmusk/status/1952052667502731723