250821 AI日报：ChatGPT 灰度上线 FlashCards；Gemini Live 实时画面提示；_前沿情报_BigSeek AI社区

warkinger 发表于 2025-8-21 13:17:51

250821 AI日报：ChatGPT 灰度上线 FlashCards；Gemini Live 实时画面提示；

<h3>OpenAI 为 ChatGPT 灰度上线 FlashCards 学习卡片功能</h3>
<video controls="controls" src="forum.php?mod=attachment&aid=2324"></video>
<p>ChatGPT 正面向部分用户灰度上线名为 FlashCards 的学习卡片功能。</p>
<p>该功能在 Study and Learn 模式下可自动生成互动测验，视频中是 X 上一位大佬分享的演示。</p>
<p>https://x.com/diegocabezas01/status/1958173175012802784</p>
<hr />
<h3>谷歌 Gemini Live 即将升级：实时画面提示与三大应用深度整合</h3>
<p><img src="data/attachment/forum/202508/21/132122nrejeobl8jlus5l5.webp" alt="ced832a49e566a2ec09be832db6bcff684288f63.webp" title="ced832a49e566a2ec09be832db6bcff684288f63.webp" /></p>
<p>谷歌宣布将对 Gemini Live 进行重大升级，新增实时画面提示功能，并深度整合 Calendar、Keep 和Tasks 三大核心应用，语音交互也更加自然流畅。值得一提的是，新版功能将于 8 月 28 日随 Pixel 10系列首发上市，随后逐步向其他 Android 及 iOS 设备推送。</p>
<p>时间过得真快，上次用谷歌的手机还是 LG 的 Nexus 5，如今遍地 AI ！完整介绍可参考官方博客。https://blog.google/products/gemini/gemini-live-updates-august-2025/</p>
<hr />
<h3>谷歌 Photo 对话式 AI 修图</h3>
<video controls="controls" src="forum.php?mod=attachment&aid=2326"></video>
<p>Google Photos 即将推出一项新功能，用户可以通过简单的语音或文字描述来编辑图片，无需手动选择工具或调整滑块。</p>
<p>该功能同样在 Pixel 10 上首发推出，并且 Google Photos 将支持C2PA Content Credentials，这意味着用户可以在Google Photos中直接看到图片是如何被捕捉或编辑的，包括是否使用了AI技术。</p>
<p>完整介绍看官方博客：https://blog.google/products/photos/ai-photo-editing-google-photos/</p>
<hr />
<h3>智谱 AutoGLM 2.0：免费云手机电脑 Agent 独立运行</h3>
<p><img src="data/attachment/forum/202508/21/132230hva26sarfrrufw2u.webp" alt="085c6e12c9ed747b34ab1fa7717b8c1fe0397e53.webp" title="085c6e12c9ed747b34ab1fa7717b8c1fe0397e53.webp" /></p>
<p>智谱 AI 正式发布了 AutoGLM 2.0，面向所有用户免费开放，并号称这是“全球首个手机 Agent”。</p>
<p>https://autoglm.zhipuai.cn/</p>
<p>新版本以“Agent + 云手机 + 云电脑”为技术底座，AI 在云端独立运行，完全不占用本地设备资源，支持 24 小时离线任务，还即将上线“定时任务”功能。</p>
<p>相当于给每个人配了个虚拟电脑或手机！我稍微看了下，手机型号是 SM-F900F，能直接接管操作，延迟超低，能<strong>联网</strong>和开启<strong>开发者选项</strong>，简直不敢想象大伙会开发出什么神奇玩法！</p>
<hr />
<h3>字节跳动Seed团队首次开源36B大语言模型</h3>
<p><img src="data/attachment/forum/202508/21/132253eq0oyc52dfhyypes.webp" alt="d8ade724291312894567de9849e097dc4af98290.webp" title="d8ade724291312894567de9849e097dc4af98290.webp" /></p>
<p>字节跳动旗下 Seed 团队正式发布 Seed-OSS系列开源大语言模型。本次开源包含三个版本：Seed-OSS-36B-Base、Seed-OSS-36B-Base-woSyn（不含合成指令数据的“纯净版”基础模型）与Seed-OSS-36B-Instruct，均以 Apache 2.0 协议开放下载。</p>
<p>没记错的话，这是字节 Seed 团队首次开源大语言模型，可以关注一下，这是他们的 Hugging Face 主页。</p>
<p>https://huggingface.co/ByteDance-Seed</p>
<hr />
<h3>快手 Klear-Reasoner：刷新多项 8B 模型基准纪录</h3>
<p><img src="data/attachment/forum/202508/21/132301dm8kebk7kkmwkhrw.webp" alt="9f351bb6d18c72da7bb6c47e82f966f8c80b08b2.webp" title="9f351bb6d18c72da7bb6c47e82f966f8c80b08b2.webp" /></p>
<p>快手科技发布了基于 Qwen3-8B-Base 的 Klear-Reasoner 模型，该模型在多项基准测试中刷新了 8B 模型的纪录，并开源了权重与完整的训练流程。不得不说，这次开源真是诚意满满！</p>
<p>https://huggingface.co/Suu/Klear-Reasoner-8B</p>
<hr />
<h3>ElevenLabs 发布 v3 Alpha API：支持 70+ 语言和无限说话人</h3>
<video controls="controls" src="forum.php?mod=attachment&aid=2330"></video>
<p>ElevenLabs 正式推出专为异步场景设计的 Eleven v3 Alpha API，支持超过 70 种语言和无限数量的说话人，号称是其迄今最具表现力的文本转语音模型。</p>
<p>完整介绍可以看官方推文：https://x.com/elevenlabsio/status/1958219938881257525</p>

anthrax 发表于 2025-8-21 13:18:26

每天看报

shadowdow 发表于 2025-8-21 13:35:29

前排占个位置啦

红鸟子 发表于 2025-8-21 17:02:50

看报啦看报啦

xiaoxiao 发表于 2025-8-23 15:22:32

看报啦，看报啦

ecg2005 发表于 2025-8-23 22:19:24

前排被占

绿希儿 发表于 2025-8-25 05:21:35

unihelper（这个词在中文语境里一般不做修改，直接使用原英文表述，不过如果你想生硬翻译的话，可译为“统一助手” ）

蓝蓝望子 发表于 2025-8-26 10:28:19

是呢

冷兔发表于 2025-8-26 11:53:43

感谢分享

软件小平 发表于 2025-8-27 16:12:27

前来读报

页: [1]

BigSeek_AI社区_AI论坛's Archiver

250821 AI日报：ChatGPT 灰度上线 FlashCards；Gemini Live 实时画面提示；