250829 AI日报：Zed 推出 ACP 协议：标准化编辑器与 Agent 通信；谷歌 Google Vid

日常闲聊 · 3 小时前

谷歌 Google Vids：视频剪辑器

Google Vids 是一款在线视频编辑工具，现已向所有用户免费开放基础编辑功能。

付费用户还可享受 Gemini、Veo3 等 AI 模型的深度集成支持，提升视频制作效率。对了，可以直接开始创建视频，又又又革了小视频宝的命。

OpenAI 发布 GPT-Realtime 及 Realtime API：实时语音模型全面升级

OpenAI 正式发布了最先进的语音到语音模型GPT-Realtime ，并全面开放 Realtime API。

https://openai.com/index/introducing-gpt-realtime/

https://platform.openai.com/docs/guides/realtime

gpt-realtime 可实时捕捉笑声、口音，支持多语言间流畅切换。

Realtime API 新增远程 MCP 服务器调用、图像输入及会话发起协议（SIP）电话拨打功能，整体还降价 20%

此外 OpenAI 同步推出两款全新声音 Cedar 与 Marin，并对现有八种声音进行音质优化。

微软推出 MAI 系列：1 秒生成 1 分钟语音的 TTS 模型

微软 AI最新发布了文本转语音(TTS)模型 MAI-Voice-1 与基础大模型 MAI-1-preview:

MAI-Voice-1 为高效语音合成系统，仅需单 GPU （官方没说是啥GPU）即可在 1 秒内生成 60 秒音频，是目前最高效的语音系统之一。

MAI-1-preview 采用混合专家架构(MoE)，在 LMArena 大模型竞技场中位列全球第 13 位。

可以在这里看完整技术细节

https://microsoft.ai/news/two-new-in-house-models/

Zed 推出 ACP 协议：标准化编辑器与 Agent 通信

Zed AI 提出并开发了 Agent Client Protocol（ACP），旨在标准化代码编辑器与 AI 编程 Agent 之间的通信，实现不同 Agent 之间的互操作性。

https://agentclientprotocol.com/

该协议尽可能重用了 Model Context Protocol（MCP）中的 JSON 表示，同时提供了专为代码场景设计的类型（如 Diff）。

目前还在早期开发阶段，不知道会有多少编辑器和 Agent 公司跟进。

不过社区已经有人开发了 acp-claude-code 这种 Bridge，可以试试看效果如何。

https://github.com/Xuanwo/acp-claude-code

xAI 推出 Grok Imagine 网页版：浏览器直接生成图像视频

xAI 已向部分用户开放 Grok Imagine 网页版，现在支持直接在浏览器中生成图像和视频！

俺这里已经灰度到了，可以看看。

https://grok.com/imagine

腾讯开源 Youtu-Agent：全开源多模型 Agent 框架

Youtu-Agent 是腾讯开源的一款轻量高效的 Agent 框架。它完全兼容 OpenAI Agents SDK，支持 DeepSeek、GPT-OSS 等多模型 API 接入，内置搜索、文件解析、数据分析等实用工具，并提供浏览器和 Shell 等沙箱环境。

项目完全开源无闭源依赖，无套路，有需要的佬不妨试试。

https://tencent.github.io/Youtu-agent/

谷歌 Stitch 更新：无限画布功能全面提升设计效率

谷歌 Stitch是一款专注于 UI 和原型设计的专业工具，最新版本支持在同一个无限画布上编辑和预览所有页面。

确实比之前要好用多了，推荐试试这个强大工具

https://stitch.withgoogle.com/

天狼啸月 · 3 小时前

我也有了

slipknot · 3 小时前

每天看报

tszqc · 3 小时前

每天看报纸

zhuxuan · 3 小时前

谷歌Google Vids：视频剪辑器

Sswfive · 3 小时前

@0v0
实时升级版 API 放出来啦！

		自动登录	找回密码
密码			立即注册

交流250829 AI日报：Zed 推出 ACP 协议：标准化编辑器与 Agent 通信；谷歌 Google Vid