GitHub Spark 公测:用自然语言构建全栈应用
GitHub Spark 正式开启公测,它能让你直接用自然语言构建和部署全栈应用。
https://github.com/spark
深度整合了 GitHub 平台的全部功能,真正做到零配置、零烦恼。
目前该服务处于公共预览阶段,仅对 Copilot Pro+ 用户开放。
更多细节可以阅读官方博客,未来会逐步扩大开放范围。
https://github.blog/changelog/2025-07-23-github-spark-in-public-preview-for-copilot-pro-subscribers/
Higgs Audio v2:开源音频生成模型
Boson AI 近日开源了其音频生成模型 Higgs Audio Generation 的第二代版本(v2)。该模型在超过 1000 万小时的多样化音频数据及对应文本数据上进行预训练,未经任何后训练或微调处理。https://boson.ai/blog/higgs-audio-v2
从官方演示效果来看,其生成质量确实不错,可以在 HF 上在线体验。
https://huggingface.co/spaces/smola/higgs_audio_v2
FreeAudio:精准可控的 AI 文生音频系统

FreeAudio 是清华大学与生数科技联合研发的精准可控文本生成音频系统。
该系统创新性地利用大语言模型进行时间结构规划,能够将复杂的文本提示和时间标记(time prompt)智能解析为一系列精准的时间窗口。
它可以实现诸如’说话时背景是鸟叫,过一会变成狗叫’这样复杂的多环境声效组合。
不过目前该项目尚未开源,相关技术细节可以通过论文和技术报告进一步了解。
https://freeaudio.github.io/FreeAudio/
昆仑天工 Mureka V7 发布:音乐 AI 性能直追 Suno 4.5
昆仑天工发布了其最新 AI 音乐模型 Mureka V7,该模型由创新的 MusiCoT(音乐思想链)框架驱动。
相比前代 V6 版本,这次升级整体表现基本追上了行业标杆 Suno 4.5 的水平!
https://x.com/Mureka_AI/status/1947972056483876934