Perplexity AI推出基于订阅制的视频生成服务
Perplexity AI在全平台推出了视频生成功能。按照订阅等级的不同,Pro用户每月能够创建5个视频,而Max用户每月则可享有15个视频的生成额度。从效果来看,其背后很可能采用了谷歌最新的Veo 3模型。
Pika AI推出音频驱动视频生成模型
Pika发布了音频驱动的视频生成模型,该模型能够近乎实时地生成具有超真实表情的视频。这项技术支持制作任意长度和风格的视频,并且能在6秒或更短时间内完成高清视频的生成。Pika表示,新模型的速度提升了20倍,同时成本也大幅降低。
官方称即将在Pika social app中推出该模型。
智谱AI开源视觉推理旗舰GLM4.5V

智谱AI正式发布了基于MOE(混合专家)架构的新一代旗舰视觉推理模型GLM4.5V,该模型支持多模态输入,并且在多个基准测试中达到了SOTA性能,现已开源并提供API服务。
特别值得一提的是,该模型采用1060亿总参数设计,其中120亿为激活参数,是当前开源领域最强的视觉推理模型。
微软推出Microsoft POML:专业级提示词编排标记语言

Microsoft POML(Prompt Orchestration Markup Language)是微软最新发布的专门用于编排提示词的标记语言,它有效解决了提示词工程中的四大痛点:结构化缺失、复杂数据整合困难、格式敏感性以及工具链不完善等问题。
微软还贴心地提供了Node.js和Python的SDK。这个项目不错,终于有人做了,可以用专门的格式来管理和维护提示词了。
Vercel v0.dev → v0.app:AI Agent模式一键生成全栈应用
Vercel旗下的v0.dev现已正式更名为v0.app,并且上线了Agent模式。
这个AI项目构建器现在升级为通用解决方案,只需一个提示词就能自动生成完整的全栈应用。完整变化可以查看官方公告,总之现在它能够自动执行并规划任务了。