Lucifer 发表于 2025-6-10 16:42:49

2025年必用的AI工具推荐 Ⅷ:通义听悟

<h2>通义听悟 - 开会必备</h2>
<p>前面的<a href="https://www.bigseek.com/ai-188-1-1.html" title="点击直达"><em>Get 笔记</em></a>确实好用,但免费版一次只能转写 10 分钟的文字。如果是会议录音这种较长的内容,用什么工具呢?</p>
<p>这里推荐阿里出品的通义听悟:https://tingwu.aliyun.com/。</p>
<p>它的核心功能是通过 TTS 技术将音视频中的语音转为文字,还能区分不同发言人,方便在回听会议录音时快速定位到具体发言人的内容,实用性很强。</p>
<p>如果你用过飞书妙记,那应该能很快上手。相比飞书妙记,通义听悟不仅支持更长的转写时长、免费使用,还融入了 AI 功能。</p>
<p><strong>具体使用方法:</strong></p>
<p>1、打开通义听悟官网,然后点击右上角的登录</p>
<p><img src="data/attachment/forum/202506/10/163815nxye71z5urx0yex1.png" alt="19e80747ddd59846646b703ed97c329a.png" title="19e80747ddd59846646b703ed97c329a.png" /></p>
<p>登录可以选择手机登录,也可以选择使用支付宝扫码。</p>
<p>然后首页这里,有两个选择,一个是实时记录,你可以理解成同声传译,你边说电脑边录制,然后实时转换成文字内容,然后你点击完成之后,完整的内容就直接出来了</p>
<p>第二个是上传音视频,就比如我今天是直接录音的,录音完之后,保存到手机里生成了一个 mp3 文件,此时就可以在这里上传我的 mp3 文件来转录<br />
<img src="data/attachment/forum/202506/10/163825bkfjkyrip8y0vjq8.png" alt="35deacebce7ca5427972066d398230dc.png" title="35deacebce7ca5427972066d398230dc.png" /></p>
<p>然后选择哪一个,都要根据实际的情况来选一下录音时的背景信息,是单人 solo 还是两人对话还是多人讨论?</p>
<p>是中文还是英文还是日语粤语等等?<br />
<img src="data/attachment/forum/202506/10/163833d3xnk3jk6c4x4a3x.png" alt="ec72e13478cfb37579b0f1c93bd7636c.png" title="ec72e13478cfb37579b0f1c93bd7636c.png" /></p>
<p><img src="data/attachment/forum/202506/10/163838w0kia022zwavemov.png" alt="e5a08e4fdcc9af53f6e0b4402ac65056.png" title="e5a08e4fdcc9af53f6e0b4402ac65056.png" /><br />
完成转录之后,会显示 AI 总结好的关键词、AI 总结的全文摘要,下面的图片是我跟朋友连麦直播完事之后,导出视频文件再上传到通义听悟处理完的结果:<br />
<img src="data/attachment/forum/202506/10/163846w9h2j9jefe9d8dhx.png" alt="a7c1d634a9a2411870bd444160525532.png" title="a7c1d634a9a2411870bd444160525532.png" /><br />
然后下面就是 AI 更细致的总结。<br />
<img src="data/attachment/forum/202506/10/163858zzlx8jpxbt5dhrb5.png" alt="452405c01136c5b044be96a713da9edc.png" title="452405c01136c5b044be96a713da9edc.png" /><br />
以及要点回顾什么,相信聪明的你肯定一看就知道是什么意思。</p>
<h5><img src="data/attachment/forum/202506/10/163907lfh005zfxrlf1ws1.png" alt="b8f560c951726a23d4813b9074f36c96.png" title="b8f560c951726a23d4813b9074f36c96.png" /></h5>
<p>接下来是一些你可能不知道的使用技巧。</p>
<pre><code>1、高效学习
</code></pre>
<p>例如,有一些直播是没有回放,而我当时没空听,怎么办呢?</p>
<p>要么让其他听课的人帮忙私下录屏,然后向对方要回放;要么自己开录屏录下来。</p>
<p>这样我们就得到了一个直播回放的 mp4 文件,此时,把这个 mp4 文件上传到通义听悟,看着语音转文字的内容,我们就可以快速定位到想看到内容,这比 2 倍速播放效率更高。</p>
<p>当我们带着问题,有了目标再去课程中找答案时,这样的效率肯定是要比漫无目的地跟着听直播效率更高的。<br />
<img src="data/attachment/forum/202506/10/163949pizqzscb95c5fp2w.png" alt="f5946ca195b4f6f28d6ae61b8ea42ed2.png" title="f5946ca195b4f6f28d6ae61b8ea42ed2.png" /></p>
<p>这一招不仅适用于直播回放,也适用于听其他线上或线下的分享。</p>
<p><strong>一边听一边打开通义听悟的实时记录功能,听完即可快速生成 AI 总结和 AI 笔记。</strong></p>
<p>例如我在 B 站看一些体检的科普视频的时候,就打开实时记录功能,边听边记录。</p>
<p>听完之后,就能快速记录下来我在做体检的时候,需要检查什么内容、注意什么事情等等。<br />
<img src="data/attachment/forum/202506/10/163959taqm1aqmja9fjmaf.png" alt="142884350d59ce57bd215fc3bf07ceac.png" title="142884350d59ce57bd215fc3bf07ceac.png" /></p>
<pre><code>2、直播/演讲表现分析
</code></pre>
<p>最近我在打造自我纠错系统的时候发现,AI 就是一个非常好的纠错来源。</p>
<p>例如做完一场直播或者做完一场演讲之后,让 AI 帮我纠错,找到我直播时不足之处。</p>
<p><strong>你可能会有疑问:AI 还能看得懂我的直播/演讲的回放视频?</strong></p>
<p>一些多模态的 AI 大模型(例如 Gemini 2.0 Pro)确实是能看得懂视频,但是如果视频很长的话,AI 处理起来速度非常非常慢。</p>
<p>而且,我们也并不需要 AI 看完一整个视频,AI 只需要听懂我的音频、甚至说能看得懂我直播时说的话的文字内容就可以了。</p>
<p>而语音转文字正是通义听悟所擅长的,我们就可以把文字内容导出来,然后复制粘贴发送给 AI 大模型,让其通过“直播字幕”来间接分析我的直播的不足之处。</p>
<p>具体操作如下:</p>
<p>前面分享过了,通义听悟是可以区分不同发言人的,点击摘取原文,即可把所有原文内容摘取到右侧笔记。<br />
<img src="data/attachment/forum/202506/10/164021mta2j3nqt9f9nnnz.png" alt="dad43b8645ee3222882ba46853bd185f.png" title="dad43b8645ee3222882ba46853bd185f.png" /></p>
<p><img src="data/attachment/forum/202506/10/164025aepb4eewvme05et0.png" alt="07f6dc8693187aa6d89fd0f56298815f.png" title="07f6dc8693187aa6d89fd0f56298815f.png" /></p>
<p>接着,由于我直播了一个多小时,所以文字内容很长很长,所以我们需要选择使用一个能处理长文本的且逻辑推理能力强的 AI 大模型。</p>
<p>如果只是擅长处理长文本但逻辑能力不强的话,那就几乎无法从这么长的文字内容中分析出我的不足之处。</p>
<p>所以,这里我选择的是 Gemini 2.0 Pro,使用下面这段提示词:</p>
<pre><code>你是一位经验丰富的直播教练和复盘专家,任务是帮助一位视频直播新手主播分析表现并提供建议。基于语音转文本记录(含时间轴、发言人和内容),按以下步骤分析:## 交流改进分析- 分析主播与嘉宾对话:  - 话题连贯性和流畅度  - 互动自然程度  - 是否有效引导对话  - 是否适时让嘉宾发挥- 指出改进点:  - 话题转换是否生硬  - 是否充分利用嘉宾专长  - 有无未深入探讨的有趣话题  - 是否加入适当幽默- 为每个改进点提供具体建议和示例## 节奏和表现分析- 根据时间轴评估:  - 发言频率  - 发言间隔  - 单次发言平均时长- 分析整体表现:  - 是否有紧张迹象(如频繁停顿、重复)  - 表达欲是否充分(主动引导话题、积极回应嘉宾)- 提供客观评价,用具体数据支持## 原因分析和改进建议- 若发现紧张或表达不足:  - 分析原因(如经验不足、准备不充分、话题不熟)  - 提供针对性建议:    - 直播前准备    - 心态调整技巧    - 提升表达能力的练习    - 更好利用嘉宾资源- 为每项建议给出具体执行步骤或练习方法## 鼓励和正面反馈- 找出主播亮点和进步,给予真诚赞美- 强调“先完成再完美”的正确性,鼓励坚持- 提供激励性话语,增强信心在分析中保持客观、具体和建设性,帮助主播认识优缺点并提供清晰、可执行的建议。若信息不足,指出并基于现有信息给出最佳分析。以下是语音转文本记录的内容:
</code></pre>
<p>看完 AI 的分析结果,我觉得是非常非常不错的,比咨询专业的直播更方便、比自己一点点看回放复盘更快,当然这不代表不需要看直播回放来复盘。<br />
<img src="data/attachment/forum/202506/10/164141lvnpauzk4npunu72.png" alt="90303ee1942a763c22083dcd3511f6cd.png" title="90303ee1942a763c22083dcd3511f6cd.png" /></p>
<p>如果是演讲的话,那也可以把视频上传发给 AI(别上传时长太长的,控制在 5 分钟以内),再让其分析演讲表现、手势、语调、动作等元素。<br />
<img src="data/attachment/forum/202506/10/164209fktjrbbhtqknffbp.png" alt="6c8b4ff7e2e619a7538300f08b1b8960.png" title="6c8b4ff7e2e619a7538300f08b1b8960.png" /></p>
<p>有一句名言叫作:</p>
<p>以铜为镜可以正衣冠,以古为镜可以知兴替,以人为镜可以明得失。</p>
<p>现在是:</p>
<p>以 AI 为镜,可以分析你的穿搭(AI 视频通话)、可以指出你的演讲/直播表现的问题并给出建议(上传视频)、可以交流讨论历史周期更替(AI 对话)。</p>

davie67 发表于 2025-6-10 17:10:36

通义的ai还是有把刷子的,之前国行iphone的ai好像就是传闻要和通义千问合作

1qaz 发表于 2025-6-16 13:00:02

这工具听着挺神啊

chenyumai 发表于 2025-6-30 15:00:02

通义听悟确实好用
页: [1]
查看完整版本: 2025年必用的AI工具推荐 Ⅷ:通义听悟