发帖
 找回密码
 立即注册
搜索
4 1 0
前沿情报 88 4 前天 16:07

GitHub Spark 公测:用自然语言构建全栈应用

GitHub Spark 正式开启公测,它能让你直接用自然语言构建和部署全栈应用。

https://github.com/spark

深度整合了 GitHub 平台的全部功能,真正做到零配置、零烦恼。

目前该服务处于公共预览阶段,仅对 Copilot Pro+ 用户开放。

更多细节可以阅读官方博客,未来会逐步扩大开放范围。

https://github.blog/changelog/2025-07-23-github-spark-in-public-preview-for-copilot-pro-subscribers/


Higgs Audio v2:开源音频生成模型

Boson AI 近日开源了其音频生成模型 Higgs Audio Generation 的第二代版本(v2)。该模型在超过 1000 万小时的多样化音频数据及对应文本数据上进行预训练,未经任何后训练或微调处理。https://boson.ai/blog/higgs-audio-v2

从官方演示效果来看,其生成质量确实不错,可以在 HF 上在线体验。

https://huggingface.co/spaces/smola/higgs_audio_v2


FreeAudio:精准可控的 AI 文生音频系统

432fe2492aa46020cbf35cc7c4e974b2424762e2.webp

FreeAudio 是清华大学与生数科技联合研发的精准可控文本生成音频系统。

该系统创新性地利用大语言模型进行时间结构规划,能够将复杂的文本提示和时间标记(time prompt)智能解析为一系列精准的时间窗口。

它可以实现诸如’说话时背景是鸟叫,过一会变成狗叫’这样复杂的多环境声效组合。

不过目前该项目尚未开源,相关技术细节可以通过论文和技术报告进一步了解。

https://freeaudio.github.io/FreeAudio/


昆仑天工 Mureka V7 发布:音乐 AI 性能直追 Suno 4.5

昆仑天工发布了其最新 AI 音乐模型 Mureka V7,该模型由创新的 MusiCoT(音乐思想链)框架驱动。

相比前代 V6 版本,这次升级整体表现基本追上了行业标杆 Suno 4.5 的水平!

https://x.com/Mureka_AI/status/1947972056483876934

──── 1人觉得很赞 ────

使用道具 举报

前天 16:24
以后要接到个电话,说话声音和自己一摸一样都不觉得惊讶了
天上的月亮
前天 16:37
声音恐怖谷效应要犯了  详情 回复
Llg
前天 16:25
快进到:妈!我被绑架了,往这个银行卡里赚XX万,他们就放了我  详情 回复
前天 16:25
txsj 发表于 2025-7-24 16:24
以后要接到个电话,说话声音和自己一摸一样都不觉得惊讶了

快进到:妈!我被绑架了,往这个银行卡里赚XX万,他们就放了我
Llg 发表于 2025-7-24 16:25
快进到:妈!我被绑架了,往这个银行卡里赚XX万,他们就放了我

这种诈骗不是早有了吗,只能说以后声音更真实了
txsj 发表于 2025-7-24 16:24
以后要接到个电话,说话声音和自己一摸一样都不觉得惊讶了

声音恐怖谷效应要犯了
您需要登录后才可以回帖 立即登录
高级模式