250818 AI日报：AIDC-AI 发布 Ovis2.5；xAI 伴侣 Ani 支持打电话；OpenAI 发布AI_前沿情报_BigSeek AI社区

warkinger 发表于 2025-8-18 13:23:50

250818 AI日报：AIDC-AI 发布 Ovis2.5；xAI 伴侣 Ani 支持打电话；OpenAI 发布AI

<h3>阿里 AIDC-AI 发布 Ovis2.5：集成NaViT的多模态模型</h3>
<p><img src="data/attachment/forum/202508/18/132657wfg6l9g6zh4ggqoq.webp" alt="3a6724ac4216d90165dc34f76f54fd7682e44ff0.webp" title="3a6724ac4216d90165dc34f76f54fd7682e44ff0.webp" /></p>
<p>阿里AIDC-AI 推出了多模态模型 Ovis2.5，提供 9B 和 2B两种参数量版本。该模型最大亮点是搭载原生视觉变换器（NaViT），突破性地支持直接处理任意原始分辨率图像——既不需要预先切片，也无需统一缩放至固定尺寸。这种创新架构完整保留了图像中的精细像素细节和全局空间布局，特别擅长解析图表、表格等结构化视觉内容。</p>
<p>现在就可以去 Hugging Face Space 调戏这个新模型</p>
<p>https://huggingface.co/spaces/AIDC-AI/Ovis2.5-9B</p>
<hr />
<h3>xAI AI 伴侣 Ani 和 Valentine 支持电话实时通话</h3>
<p><img src="data/attachment/forum/202508/18/132714o881c41y51wv0z49.webp" alt="b1ad1932b3c981bc1d057285f5e8e48220f58500.webp" title="b1ad1932b3c981bc1d057285f5e8e48220f58500.webp" /></p>
<p>xAI 最新推出的 AI 伴侣 Ani 和 Valentine 现已支持电话实时通话功能！</p>
<p>https://x.com/cb_doge/status/1956627604108128401</p>
<p>现在，你可以像给朋友打电话一样，直接拨打 +1 (325) 225-5264（Ani）或 +1 (607) 225-5825（Valentine），与你的 AI 伴侣进行自然流畅的语音交流。</p>
<hr />
<h3>OpenAI 发布生产级 AI 应用开发全栈学习路径</h3>
<p><img src="data/attachment/forum/202508/18/132736v0kyneqffk0urhcy.webp" alt="361765618bf926bb54f1236d551041d962c9db26.webp" title="361765618bf926bb54f1236d551041d962c9db26.webp" /></p>
<p>OpenAI最新推出了从入门到生产级的 AI 应用开发学习路径，学习后能够掌握AI基础概念，将其融入 AI 应用开发中，评估应用性能，并实施最佳实践以确保AI解决方案稳健且可大规模部署。</p>
<p>教程非常详细，只需要略懂 js 或者 python 就行学习。</p>
<p>https://developers.openai.com/tracks/ai-application-development/</p>
<hr />
<h3>字节 Trae 推出内置 Figma-to-code 功能</h3>
<video controls="controls" src="forum.php?mod=attachment&aid=2241"></video>
<p>Trae 在其产品的 Solo 模式中新增了内置 Figma-to-code 功能。</p>
<p>https://x.com/Trae_ai/status/1956012951980343651</p>
<p>这个功能可以将用户的设计直接转化为可工作的代码，大大提升了开发效率。</p>
<p>不得不说 Trae 这个工具越来越强大了，虽然铺天盖地的宣传确实有点烦</p>
<hr />
<h3>阿里 Wan2.2-I2V-Flash 图像转视频模型</h3>
<p><img src="data/attachment/forum/202508/18/132841wqyo6qgq4bcb63gn.webp" alt="709454bbfc3d374fa8a9846556e8a063f8bc4e67.webp" title="709454bbfc3d374fa8a9846556e8a063f8bc4e67.webp" /></p>
<p>阿里巴巴万相（Wan）团队发布了 Wan2.2-I2V-Flash 图像转视频模型。</p>
<p>https://x.com/Alibaba_Wan/status/1956263194982552036</p>
<p>该模型推理速度相比前代提升了惊人的 12 倍，同时显著增强了指令遵循和风格保持能力，特别适合需要快速生成风格统一视频内容的场景。</p>
<p>不过遗憾的是，目前该模型仅通过 API 提供服务，权重并未公开</p>
<hr />
<h3>ElevenLabs 发布智能视频配乐生成功能</h3>
<video controls="controls" src="forum.php?mod=attachment&aid=2243"></video>
<p>ElevenLabs Studio 中推出了 Video-to-Music 新功能，用户现在可以一键操作，让 Eleven Music 模型根据视频的上下文智能生成定制背景配乐。</p>
<p>这个 AI 能自动分析视频内容，匹配合适的音乐风格和情绪节奏。</p>
<p>详情可以查看官方推文，这个功能把视频创作的配乐门槛降到了新低。</p>
<p>https://x.com/elevenlabsio/status/1956406489356333225</p>

暗甜鱼子 发表于 2025-8-18 13:47:55

每天看报

中国网站运营网 发表于 2025-8-18 13:58:07

看报啦，看报啦

暖土花 发表于 2025-8-18 14:05:31

进来看报

Lucentio 发表于 2025-8-18 15:49:33

每天看报纸

lukeluk 发表于 2025-8-18 19:48:31

又来看报了

ccbyoujian 发表于 2025-8-19 11:12:46

Eric_H 发表于 2025-8-20 18:40:36

进来看报

kl2272 发表于 2025-8-25 20:10:34

前排看报！

苯鸟发表于 3 天前

AI新成果真不少

页: [1]

BigSeek_AI社区_AI论坛's Archiver

250818 AI日报：AIDC-AI 发布 Ovis2.5；xAI 伴侣 Ani 支持打电话；OpenAI 发布AI