谷歌 Google Vids:视频剪辑器
Google Vids 是一款在线视频编辑工具,现已向所有用户免费开放基础编辑功能。
付费用户还可享受 Gemini、Veo3 等 AI 模型的深度集成支持,提升视频制作效率。对了,可以直接开始创建视频,又又又革了小视频宝的命。
OpenAI 发布 GPT-Realtime 及 Realtime API:实时语音模型全面升级

OpenAI 正式发布了最先进的语音到语音模型GPT-Realtime ,并全面开放 Realtime API。
https://openai.com/index/introducing-gpt-realtime/
https://platform.openai.com/docs/guides/realtime
gpt-realtime 可实时捕捉笑声、口音,支持多语言间流畅切换。
Realtime API 新增远程 MCP 服务器调用、图像输入及会话发起协议(SIP)电话拨打功能,整体还降价 20%
此外 OpenAI 同步推出两款全新声音 Cedar 与 Marin,并对现有八种声音进行音质优化。
微软推出 MAI 系列:1 秒生成 1 分钟语音的 TTS 模型

微软 AI最新发布了文本转语音(TTS)模型 MAI-Voice-1 与基础大模型 MAI-1-preview:
MAI-Voice-1 为高效语音合成系统,仅需单 GPU (官方没说是啥GPU)即可在 1 秒内生成 60 秒音频,是目前最高效的语音系统之一。
MAI-1-preview 采用混合专家架构(MoE),在 LMArena 大模型竞技场中位列全球第 13 位。
可以在这里看完整技术细节
https://microsoft.ai/news/two-new-in-house-models/
Zed 推出 ACP 协议:标准化编辑器与 Agent 通信

Zed AI 提出并开发了 Agent Client Protocol(ACP),旨在标准化代码编辑器与 AI 编程 Agent 之间的通信,实现不同 Agent 之间的互操作性。
https://agentclientprotocol.com/
该协议尽可能重用了 Model Context Protocol(MCP)中的 JSON 表示,同时提供了专为代码场景设计的类型(如 Diff)。
目前还在早期开发阶段,不知道会有多少编辑器和 Agent 公司跟进。
不过社区已经有人开发了 acp-claude-code 这种 Bridge,可以试试看效果如何。
https://github.com/Xuanwo/acp-claude-code
xAI 推出 Grok Imagine 网页版:浏览器直接生成图像视频

xAI 已向部分用户开放 Grok Imagine 网页版,现在支持直接在浏览器中生成图像和视频!
俺这里已经灰度到了,可以看看。
https://grok.com/imagine
腾讯开源 Youtu-Agent:全开源多模型 Agent 框架

Youtu-Agent 是腾讯开源的一款轻量高效的 Agent 框架。它完全兼容 OpenAI Agents SDK,支持 DeepSeek、GPT-OSS 等多模型 API 接入,内置搜索、文件解析、数据分析等实用工具,并提供浏览器和 Shell 等沙箱环境。
项目完全开源无闭源依赖,无套路,有需要的佬不妨试试。
https://tencent.github.io/Youtu-agent/
谷歌 Stitch 更新:无限画布功能全面提升设计效率
谷歌 Stitch是一款专注于 UI 和原型设计的专业工具,最新版本支持在同一个无限画布上编辑和预览所有页面。
确实比之前要好用多了,推荐试试这个强大工具
https://stitch.withgoogle.com/