250724 AI日报：GitHub Spark 公测；Higgs开源音频生成模型；Mureka V7 发布

前沿情报 · 2025-7-24 16:07:11

GitHub Spark 正式开启公测，它能让你直接用自然语言构建和部署全栈应用。

https://github.com/spark

深度整合了 GitHub 平台的全部功能，真正做到零配置、零烦恼。

目前该服务处于公共预览阶段，仅对 Copilot Pro+ 用户开放。

更多细节可以阅读官方博客，未来会逐步扩大开放范围。

https://github.blog/changelog/2025-07-23-github-spark-in-public-preview-for-copilot-pro-subscribers/

Boson AI 近日开源了其音频生成模型 Higgs Audio Generation 的第二代版本（v2）。该模型在超过 1000 万小时的多样化音频数据及对应文本数据上进行预训练，未经任何后训练或微调处理。https://boson.ai/blog/higgs-audio-v2

从官方演示效果来看，其生成质量确实不错，可以在 HF 上在线体验。

https://huggingface.co/spaces/smola/higgs_audio_v2

FreeAudio 是清华大学与生数科技联合研发的精准可控文本生成音频系统。

该系统创新性地利用大语言模型进行时间结构规划，能够将复杂的文本提示和时间标记(time prompt)智能解析为一系列精准的时间窗口。

它可以实现诸如’说话时背景是鸟叫，过一会变成狗叫’这样复杂的多环境声效组合。

不过目前该项目尚未开源，相关技术细节可以通过论文和技术报告进一步了解。

https://freeaudio.github.io/FreeAudio/

昆仑天工发布了其最新 AI 音乐模型 Mureka V7，该模型由创新的 MusiCoT（音乐思想链）框架驱动。

相比前代 V6 版本，这次升级整体表现基本追上了行业标杆 Suno 4.5 的水平！

https://x.com/Mureka_AI/status/1947972056483876934

txsj · 2025-7-24 16:24:28

以后要接到个电话，说话声音和自己一摸一样都不觉得惊讶了

Llg · 2025-7-24 16:25:03

txsj 发表于 2025-7-24 16:24
以后要接到个电话，说话声音和自己一摸一样都不觉得惊讶了

快进到：妈！我被绑架了，往这个银行卡里赚XX万，他们就放了我

magic886 · 2025-7-24 16:25:33

Llg 发表于 2025-7-24 16:25
快进到：妈！我被绑架了，往这个银行卡里赚XX万，他们就放了我

这种诈骗不是早有了吗，只能说以后声音更真实了

天上的月亮 · 2025-7-24 16:37:08

txsj 发表于 2025-7-24 16:24
以后要接到个电话，说话声音和自己一摸一样都不觉得惊讶了

声音恐怖谷效应要犯了

		自动登录	找回密码
密码			立即注册

新品250724 AI日报：GitHub Spark 公测；Higgs开源音频生成模型；Mureka V7 发布