250724 AI日报:GitHub Spark 公测;Higgs开源音频生成模型;Mureka V7 发布
<h3>GitHub Spark 公测:用自然语言构建全栈应用</h3><iframe src="https://player.bilibili.com/player.html?isOutside=true&aid=114905743102689&bvid=BV1np8Tz1EQd&cid=31241079428&p=1" scrolling="no" border="0" frameborder="no" framespacing="0" allowfullscreen="true"></iframe>
<p>GitHub Spark 正式开启公测,它能让你直接用自然语言构建和部署全栈应用。</p>
<p>https://github.com/spark</p>
<p>深度整合了 GitHub 平台的全部功能,真正做到零配置、零烦恼。</p>
<p>目前该服务处于公共预览阶段,仅对 Copilot Pro+ 用户开放。</p>
<p>更多细节可以阅读官方博客,未来会逐步扩大开放范围。</p>
<p>https://github.blog/changelog/2025-07-23-github-spark-in-public-preview-for-copilot-pro-subscribers/</p>
<hr />
<h3>Higgs Audio v2:开源音频生成模型</h3>
<iframe src="https://player.bilibili.com/player.html?isOutside=true&aid=114899602644485&bvid=BV1LGbozkEDY&cid=31218074809&p=1" scrolling="no" border="0" frameborder="no" framespacing="0" allowfullscreen="true"></iframe>
<p>Boson AI 近日开源了其音频生成模型 Higgs Audio Generation 的第二代版本(v2)。该模型在超过 1000 万小时的多样化音频数据及对应文本数据上进行预训练,未经任何后训练或微调处理。https://boson.ai/blog/higgs-audio-v2</p>
<p>从官方演示效果来看,其生成质量确实不错,可以在 HF 上在线体验。</p>
<p>https://huggingface.co/spaces/smola/higgs_audio_v2</p>
<hr />
<h3>FreeAudio:精准可控的 AI 文生音频系统</h3>
<p><img src="https://images.bigseek.com//forum/202507/24/160542mi8qvz7kc11cbq17.webp" alt="432fe2492aa46020cbf35cc7c4e974b2424762e2.webp" title="432fe2492aa46020cbf35cc7c4e974b2424762e2.webp" /></p>
<p>FreeAudio 是清华大学与生数科技联合研发的精准可控文本生成音频系统。</p>
<p>该系统创新性地利用大语言模型进行时间结构规划,能够将复杂的文本提示和时间标记(time prompt)智能解析为一系列精准的时间窗口。</p>
<p>它可以实现诸如’说话时背景是鸟叫,过一会变成狗叫’这样复杂的多环境声效组合。</p>
<p>不过目前该项目尚未开源,相关技术细节可以通过论文和技术报告进一步了解。</p>
<p>https://freeaudio.github.io/FreeAudio/</p>
<hr />
<h3>昆仑天工 Mureka V7 发布:音乐 AI 性能直追 Suno 4.5</h3>
<iframe src="https://player.bilibili.com/player.html?isOutside=true&aid=114905759883128&bvid=BV1nH8TzjE2D&cid=31241143402&p=1" scrolling="no" border="0" frameborder="no" framespacing="0" allowfullscreen="true"></iframe>
<p>昆仑天工发布了其最新 AI 音乐模型 Mureka V7,该模型由创新的 MusiCoT(音乐思想链)框架驱动。</p>
<p>相比前代 V6 版本,这次升级整体表现基本追上了行业标杆 Suno 4.5 的水平!</p>
<p>https://x.com/Mureka_AI/status/1947972056483876934</p>
以后要接到个电话,说话声音和自己一摸一样都不觉得惊讶了 txsj 发表于 2025-7-24 16:24
以后要接到个电话,说话声音和自己一摸一样都不觉得惊讶了
快进到:妈!我被绑架了,往这个银行卡里赚XX万,他们就放了我 Llg 发表于 2025-7-24 16:25
快进到:妈!我被绑架了,往这个银行卡里赚XX万,他们就放了我
这种诈骗不是早有了吗,只能说以后声音更真实了 txsj 发表于 2025-7-24 16:24
以后要接到个电话,说话声音和自己一摸一样都不觉得惊讶了
声音恐怖谷效应要犯了
页:
[1]