OpenAI 为 ChatGPT 推出开发者模式,支持自定义 MCP 服务器连接

ChatGPT 面向 Pro 用户与 Plus 用户推出开发者模式,启用后支持添加任意自定义 MCP 服务器,支持协议包括 SSE 与流式 HTTP。完整功能介绍可以查看官方文档
https://platform.openai.com/docs/guides/developer-mode
谷歌正式开放 NotebookLM 企业版 API
NotebookLM 企业版现已开放 API,支持对笔记本进行创建、读取、共享和数据源管理等操作。
https://cloud.google.com/agentspace/notebooklm-enterprise/docs/api-notebooks
月之暗面开源 checkpoint-engine

月之暗面开源的 checkpoint-engine 是个专为 LLM 推理引擎设计的中间件,能在约 20 秒内完成 1 万亿参数的 Kimi-K2 模型在数千个 GPU 上的权重同步,分布式福音。
https://github.com/MoonshotAI/checkpoint-engine
ElevenLabs 发布语音重塑工具 Voice Remixing
ElevenLabs 推出 Voice Remixing alpha测试版,用户能够通过提示词设计、改造声音,实现性别、年龄感和口音的变换。
现在就能在官网直接开玩,官方还贴心地提供了最佳实践文档,记得先去瞅瞅哈!
https://elevenlabs.io/app/voice-library?action=create&creationType=voiceRemix
NVIDIA 发布 Rubin CPX GPU:专为百万级 Token 上下文AI推理设计

根据 NVIDIA 官方新闻,NVIDIA 发布了全新 GPU:NVIDIA Rubin CPX,这是一款专为长上下文 AI 推理设计的新型处理器,配备 128GB GDDR7 显存,旨在支持百万级 Token 上下文长度的软件开发、生成式视频创作以及深度研究等复杂任务。
不过正式推出预计要等到 2026 年底,有需要的话可能还得再等等 。
https://nvidianews.nvidia.com/news/nvidia-unveils-rubin-cpx-a-new-class-of-gpu-designed-for-massive-context-inference
Decart 发布 Lucy 图生视频模型:比 wan 速度快 7 倍

Decart 发布了Lucy 系列图生视频模型,包含 14B 和 5B 两个版本。其 14B 模型与 WAN v2.2-14B 相比,在同等质量下生成速度提升了 7 倍,5 秒视频仅需 6.2 秒即可生成。
https://x.com/DecartAI/status/1965841831956197585
不过目前该模型似乎没有开源计划,已经上线 fal 平台,标价为每秒 0.08 美元,有需要的佬们可以试试看效果如何。
https://fal.ai/models/decart/lucy-14b/image-to-video/playground