warkinger 发表于 2025-8-12 13:43:01

250812 三花AI日报:Perplexity AI 推出视频生成;Pika AI 推出音频驱动视频生成模型

<h2>Perplexity AI推出基于订阅制的视频生成服务</h2>
<iframe src="https://player.bilibili.com/player.html?isOutside=true&amp;aid=115013436052708&amp;bvid=BV1WctXz6EqJ&amp;cid=31636851886&amp;p=1&amp;danmaku=0" scrolling="no" border="0" frameborder="no" framespacing="0" allowfullscreen="true"></iframe>
<p>Perplexity AI在全平台推出了视频生成功能。按照订阅等级的不同,Pro用户每月能够创建5个视频,而Max用户每月则可享有15个视频的生成额度。从效果来看,其背后很可能采用了谷歌最新的Veo 3模型。</p>
<h2>Pika AI推出音频驱动视频生成模型</h2>
<iframe src="https://player.bilibili.com/player.html?isOutside=true&amp;aid=115013452896011&amp;bvid=BV1i7tXzfEtm&amp;cid=31636852712&amp;p=1&amp;danmaku=0" scrolling="no" border="0" frameborder="no" framespacing="0" allowfullscreen="true"></iframe>
<p>Pika发布了音频驱动的视频生成模型,该模型能够近乎实时地生成具有超真实表情的视频。这项技术支持制作任意长度和风格的视频,并且能在6秒或更短时间内完成高清视频的生成。Pika表示,新模型的速度提升了20倍,同时成本也大幅降低。</p>
<p>官方称即将在Pika social app中推出该模型。</p>
<h2>智谱AI开源视觉推理旗舰GLM4.5V</h2>
<p><img src="https://www.bigseek.com/forum.php?mod=image&amp;aid=2187&amp;size=300x300&amp;key=089e25a1651aee05&amp;nocache=yes&amp;type=fixnone" alt="" /></p>
<p>智谱AI正式发布了基于MOE(混合专家)架构的新一代旗舰视觉推理模型GLM4.5V,该模型支持多模态输入,并且在多个基准测试中达到了SOTA性能,现已开源并提供API服务。</p>
<p>特别值得一提的是,该模型采用1060亿总参数设计,其中120亿为激活参数,是当前开源领域最强的视觉推理模型。</p>
<h2>微软推出Microsoft POML:专业级提示词编排标记语言</h2>
<p><img src="https://www.bigseek.com/forum.php?mod=image&amp;aid=2188&amp;size=300x300&amp;key=01cb62d77678c9c1&amp;nocache=yes&amp;type=fixnone" alt="" /></p>
<p>Microsoft POML(Prompt Orchestration Markup Language)是微软最新发布的专门用于编排提示词的标记语言,它有效解决了提示词工程中的四大痛点:结构化缺失、复杂数据整合困难、格式敏感性以及工具链不完善等问题。</p>
<p>微软还贴心地提供了Node.js和Python的SDK。这个项目不错,终于有人做了,可以用专门的格式来管理和维护提示词了。</p>
<h2>Vercel v0.dev → v0.app:AI Agent模式一键生成全栈应用</h2>
<iframe src="https://player.bilibili.com/player.html?isOutside=true&amp;aid=115013436115653&amp;bvid=BV1kctXz6EC5&amp;cid=31636851340&amp;p=1&amp;danmaku=0" scrolling="no" border="0" frameborder="no" framespacing="0" allowfullscreen="true"></iframe>
<p>Vercel旗下的v0.dev现已正式更名为v0.app,并且上线了Agent模式。</p>
<p>这个AI项目构建器现在升级为通用解决方案,只需一个提示词就能自动生成完整的全栈应用。完整变化可以查看官方公告,总之现在它能够自动执行并规划任务了。</p>

老草 发表于 2025-8-12 15:05:03

每天看报纸

charden 发表于 2025-8-12 15:20:44

新人来读日报了

为爱 发表于 2025-8-12 15:38:52

每日看报
看报看报

红龙 发表于 2025-8-12 15:48:55

POML越来越标准化了,这是好事。只是不清楚参与者有多少。

dle5374 发表于 2025-8-12 16:40:04

每日在前面位置看报

高云月 发表于 2025-8-12 17:47:45

每天看报

小草与叶子 发表于 2025-8-12 20:07:57

每天看报

叛逆∵生活 发表于 2025-8-13 20:44:59

今日看报,感谢三花₍˄·͈༝·͈˄₎◞ ̑̑

parasite 发表于 2025-8-14 08:31:02

读报看AI新闻

ATQQ 发表于 2025-8-15 02:56:05

先把一楼占了

xianwlg 发表于 2025-8-15 05:19:04

看报!!

Jon郭玉斌ค 发表于 2025-8-18 09:09:29

每天看报

今晚吃啥 发表于 2025-8-18 10:05:58


Sprite 发表于 2025-8-18 20:01:09

看报啦,看报啦

ccbyoujian 发表于 2025-8-19 18:33:27

前排吃瓜,不知道POML对性能之类的有没有提升
页: [1]
查看完整版本: 250812 三花AI日报:Perplexity AI 推出视频生成;Pika AI 推出音频驱动视频生成模型