250724 AI日报：GitHub Spark 公测；Higgs开源音频生成模型；Mureka V7 发布_前沿情报_BigSeek AI社区

warkinger 发表于 2025-7-24 16:07:11

250724 AI日报：GitHub Spark 公测；Higgs开源音频生成模型；Mureka V7 发布

<h3>GitHub Spark 公测：用自然语言构建全栈应用</h3>
<iframe src="https://player.bilibili.com/player.html?isOutside=true&aid=114905743102689&bvid=BV1np8Tz1EQd&cid=31241079428&p=1" scrolling="no" border="0" frameborder="no" framespacing="0" allowfullscreen="true"></iframe>
<p>GitHub Spark 正式开启公测，它能让你直接用自然语言构建和部署全栈应用。</p>
<p>https://github.com/spark</p>
<p>深度整合了 GitHub 平台的全部功能，真正做到零配置、零烦恼。</p>
<p>目前该服务处于公共预览阶段，仅对 Copilot Pro+ 用户开放。</p>
<p>更多细节可以阅读官方博客，未来会逐步扩大开放范围。</p>
<p>https://github.blog/changelog/2025-07-23-github-spark-in-public-preview-for-copilot-pro-subscribers/</p>
<hr />
<h3>Higgs Audio v2：开源音频生成模型</h3>
<iframe src="https://player.bilibili.com/player.html?isOutside=true&aid=114899602644485&bvid=BV1LGbozkEDY&cid=31218074809&p=1" scrolling="no" border="0" frameborder="no" framespacing="0" allowfullscreen="true"></iframe>
<p>Boson AI 近日开源了其音频生成模型 Higgs Audio Generation 的第二代版本（v2）。该模型在超过 1000 万小时的多样化音频数据及对应文本数据上进行预训练，未经任何后训练或微调处理。https://boson.ai/blog/higgs-audio-v2</p>
<p>从官方演示效果来看，其生成质量确实不错，可以在 HF 上在线体验。</p>
<p>https://huggingface.co/spaces/smola/higgs_audio_v2</p>
<hr />
<h3>FreeAudio：精准可控的 AI 文生音频系统</h3>
<p><img src="https://images.bigseek.com//forum/202507/24/160542mi8qvz7kc11cbq17.webp" alt="432fe2492aa46020cbf35cc7c4e974b2424762e2.webp" title="432fe2492aa46020cbf35cc7c4e974b2424762e2.webp" /></p>
<p>FreeAudio 是清华大学与生数科技联合研发的精准可控文本生成音频系统。</p>
<p>该系统创新性地利用大语言模型进行时间结构规划，能够将复杂的文本提示和时间标记(time prompt)智能解析为一系列精准的时间窗口。</p>
<p>它可以实现诸如’说话时背景是鸟叫，过一会变成狗叫’这样复杂的多环境声效组合。</p>
<p>不过目前该项目尚未开源，相关技术细节可以通过论文和技术报告进一步了解。</p>
<p>https://freeaudio.github.io/FreeAudio/</p>
<hr />
<h3>昆仑天工 Mureka V7 发布：音乐 AI 性能直追 Suno 4.5</h3>
<iframe src="https://player.bilibili.com/player.html?isOutside=true&aid=114905759883128&bvid=BV1nH8TzjE2D&cid=31241143402&p=1" scrolling="no" border="0" frameborder="no" framespacing="0" allowfullscreen="true"></iframe>
<p>昆仑天工发布了其最新 AI 音乐模型 Mureka V7，该模型由创新的 MusiCoT（音乐思想链）框架驱动。</p>
<p>相比前代 V6 版本，这次升级整体表现基本追上了行业标杆 Suno 4.5 的水平！</p>
<p>https://x.com/Mureka_AI/status/1947972056483876934</p>

txsj 发表于 2025-7-24 16:24:28

以后要接到个电话，说话声音和自己一摸一样都不觉得惊讶了

Llg 发表于 2025-7-24 16:25:03

txsj 发表于 2025-7-24 16:24
以后要接到个电话，说话声音和自己一摸一样都不觉得惊讶了

快进到：妈！我被绑架了，往这个银行卡里赚XX万，他们就放了我

magic886 发表于 2025-7-24 16:25:33

Llg 发表于 2025-7-24 16:25
快进到：妈！我被绑架了，往这个银行卡里赚XX万，他们就放了我

这种诈骗不是早有了吗，只能说以后声音更真实了

天上的月亮 发表于 2025-7-24 16:37:08

txsj 发表于 2025-7-24 16:24
以后要接到个电话，说话声音和自己一摸一样都不觉得惊讶了

声音恐怖谷效应要犯了

页: [1]

BigSeek_AI社区_AI论坛's Archiver

250724 AI日报：GitHub Spark 公测；Higgs开源音频生成模型；Mureka V7 发布