250821 AI日报:ChatGPT 灰度上线 FlashCards;Gemini Live 实时画面提示;
<h3>OpenAI 为 ChatGPT 灰度上线 FlashCards 学习卡片功能</h3><video controls="controls" src="forum.php?mod=attachment&aid=2324"></video>
<p>ChatGPT 正面向部分用户灰度上线名为 FlashCards 的学习卡片功能。</p>
<p>该功能在 Study and Learn 模式下可自动生成互动测验,视频中是 X 上一位大佬分享的演示。</p>
<p>https://x.com/diegocabezas01/status/1958173175012802784</p>
<hr />
<h3>谷歌 Gemini Live 即将升级:实时画面提示与三大应用深度整合</h3>
<p><img src="data/attachment/forum/202508/21/132122nrejeobl8jlus5l5.webp" alt="ced832a49e566a2ec09be832db6bcff684288f63.webp" title="ced832a49e566a2ec09be832db6bcff684288f63.webp" /></p>
<p>谷歌宣布将对 Gemini Live 进行重大升级,新增实时画面提示功能,并深度整合 Calendar、Keep 和Tasks 三大核心应用,语音交互也更加自然流畅。值得一提的是,新版功能将于 8 月 28 日随 Pixel 10系列首发上市,随后逐步向其他 Android 及 iOS 设备推送。</p>
<p>时间过得真快,上次用谷歌的手机还是 LG 的 Nexus 5,如今遍地 AI !完整介绍可参考官方博客。https://blog.google/products/gemini/gemini-live-updates-august-2025/</p>
<hr />
<h3>谷歌 Photo 对话式 AI 修图</h3>
<video controls="controls" src="forum.php?mod=attachment&aid=2326"></video>
<p>Google Photos 即将推出一项新功能,用户可以通过简单的语音或文字描述来编辑图片,无需手动选择工具或调整滑块。</p>
<p>该功能同样在 Pixel 10 上首发推出,并且 Google Photos 将支持C2PA Content Credentials,这意味着用户可以在Google Photos中直接看到图片是如何被捕捉或编辑的,包括是否使用了AI技术。</p>
<p>完整介绍看官方博客:https://blog.google/products/photos/ai-photo-editing-google-photos/</p>
<hr />
<h3>智谱 AutoGLM 2.0: 免费云手机电脑 Agent 独立运行</h3>
<p><img src="data/attachment/forum/202508/21/132230hva26sarfrrufw2u.webp" alt="085c6e12c9ed747b34ab1fa7717b8c1fe0397e53.webp" title="085c6e12c9ed747b34ab1fa7717b8c1fe0397e53.webp" /></p>
<p>智谱 AI 正式发布了 AutoGLM 2.0,面向所有用户免费开放,并号称这是“全球首个手机 Agent”。</p>
<p>https://autoglm.zhipuai.cn/</p>
<p>新版本以“Agent + 云手机 + 云电脑”为技术底座,AI 在云端独立运行,完全不占用本地设备资源,支持 24 小时离线任务,还即将上线“定时任务”功能。</p>
<p>相当于给每个人配了个虚拟电脑或手机!我稍微看了下,手机型号是 SM-F900F,能直接接管操作,延迟超低,能<strong>联网</strong>和开启<strong>开发者选项</strong>,简直不敢想象大伙会开发出什么神奇玩法!</p>
<hr />
<h3>字节跳动Seed团队首次开源36B大语言模型</h3>
<p><img src="data/attachment/forum/202508/21/132253eq0oyc52dfhyypes.webp" alt="d8ade724291312894567de9849e097dc4af98290.webp" title="d8ade724291312894567de9849e097dc4af98290.webp" /></p>
<p>字节跳动旗下 Seed 团队正式发布 Seed-OSS系列开源大语言模型。本次开源包含三个版本:Seed-OSS-36B-Base、Seed-OSS-36B-Base-woSyn(不含合成指令数据的“纯净版”基础模型)与Seed-OSS-36B-Instruct,均以 Apache 2.0 协议开放下载。</p>
<p>没记错的话,这是字节 Seed 团队首次开源大语言模型,可以关注一下,这是他们的 Hugging Face 主页。</p>
<p>https://huggingface.co/ByteDance-Seed</p>
<hr />
<h3>快手 Klear-Reasoner:刷新多项 8B 模型基准纪录</h3>
<p><img src="data/attachment/forum/202508/21/132301dm8kebk7kkmwkhrw.webp" alt="9f351bb6d18c72da7bb6c47e82f966f8c80b08b2.webp" title="9f351bb6d18c72da7bb6c47e82f966f8c80b08b2.webp" /></p>
<p>快手科技发布了基于 Qwen3-8B-Base 的 Klear-Reasoner 模型,该模型在多项基准测试中刷新了 8B 模型的纪录,并开源了权重与完整的训练流程。不得不说,这次开源真是诚意满满!</p>
<p>https://huggingface.co/Suu/Klear-Reasoner-8B</p>
<hr />
<h3>ElevenLabs 发布 v3 Alpha API:支持 70+ 语言和无限说话人</h3>
<video controls="controls" src="forum.php?mod=attachment&aid=2330"></video>
<p>ElevenLabs 正式推出专为异步场景设计的 Eleven v3 Alpha API,支持超过 70 种语言和无限数量的说话人,号称是其迄今最具表现力的文本转语音模型。</p>
<p>完整介绍可以看官方推文:https://x.com/elevenlabsio/status/1958219938881257525</p>
每天看报 前排占个位置啦 看报啦 看报啦 看报啦,看报啦 前排被占 unihelper(这个词在中文语境里一般不做修改,直接使用原英文表述,不过如果你想生硬翻译的话,可译为“统一助手” ) 是呢 感谢分享 前来读报
页:
[1]