通义听悟 - 开会必备
前面的Get 笔记确实好用,但免费版一次只能转写 10 分钟的文字。如果是会议录音这种较长的内容,用什么工具呢?
这里推荐阿里出品的通义听悟:https://tingwu.aliyun.com/。
它的核心功能是通过 TTS 技术将音视频中的语音转为文字,还能区分不同发言人,方便在回听会议录音时快速定位到具体发言人的内容,实用性很强。
如果你用过飞书妙记,那应该能很快上手。相比飞书妙记,通义听悟不仅支持更长的转写时长、免费使用,还融入了 AI 功能。
具体使用方法:
1、打开通义听悟官网,然后点击右上角的登录

登录可以选择手机登录,也可以选择使用支付宝扫码。
然后首页这里,有两个选择,一个是实时记录,你可以理解成同声传译,你边说电脑边录制,然后实时转换成文字内容,然后你点击完成之后,完整的内容就直接出来了
第二个是上传音视频,就比如我今天是直接录音的,录音完之后,保存到手机里生成了一个 mp3 文件,此时就可以在这里上传我的 mp3 文件来转录

然后选择哪一个,都要根据实际的情况来选一下录音时的背景信息,是单人 solo 还是两人对话还是多人讨论?
是中文还是英文还是日语粤语等等?


完成转录之后,会显示 AI 总结好的关键词、AI 总结的全文摘要,下面的图片是我跟朋友连麦直播完事之后,导出视频文件再上传到通义听悟处理完的结果:

然后下面就是 AI 更细致的总结。

以及要点回顾什么,相信聪明的你肯定一看就知道是什么意思。

接下来是一些你可能不知道的使用技巧。
1、高效学习
例如,有一些直播是没有回放,而我当时没空听,怎么办呢?
要么让其他听课的人帮忙私下录屏,然后向对方要回放;要么自己开录屏录下来。
这样我们就得到了一个直播回放的 mp4 文件,此时,把这个 mp4 文件上传到通义听悟,看着语音转文字的内容,我们就可以快速定位到想看到内容,这比 2 倍速播放效率更高。
当我们带着问题,有了目标再去课程中找答案时,这样的效率肯定是要比漫无目的地跟着听直播效率更高的。

这一招不仅适用于直播回放,也适用于听其他线上或线下的分享。
一边听一边打开通义听悟的实时记录功能,听完即可快速生成 AI 总结和 AI 笔记。
例如我在 B 站看一些体检的科普视频的时候,就打开实时记录功能,边听边记录。
听完之后,就能快速记录下来我在做体检的时候,需要检查什么内容、注意什么事情等等。

2、直播/演讲表现分析
最近我在打造自我纠错系统的时候发现,AI 就是一个非常好的纠错来源。
例如做完一场直播或者做完一场演讲之后,让 AI 帮我纠错,找到我直播时不足之处。
你可能会有疑问:AI 还能看得懂我的直播/演讲的回放视频?
一些多模态的 AI 大模型(例如 Gemini 2.0 Pro)确实是能看得懂视频,但是如果视频很长的话,AI 处理起来速度非常非常慢。
而且,我们也并不需要 AI 看完一整个视频,AI 只需要听懂我的音频、甚至说能看得懂我直播时说的话的文字内容就可以了。
而语音转文字正是通义听悟所擅长的,我们就可以把文字内容导出来,然后复制粘贴发送给 AI 大模型,让其通过“直播字幕”来间接分析我的直播的不足之处。
具体操作如下:
前面分享过了,通义听悟是可以区分不同发言人的,点击摘取原文,即可把所有原文内容摘取到右侧笔记。


接着,由于我直播了一个多小时,所以文字内容很长很长,所以我们需要选择使用一个能处理长文本的且逻辑推理能力强的 AI 大模型。
如果只是擅长处理长文本但逻辑能力不强的话,那就几乎无法从这么长的文字内容中分析出我的不足之处。
所以,这里我选择的是 Gemini 2.0 Pro,使用下面这段提示词:
你是一位经验丰富的直播教练和复盘专家,任务是帮助一位视频直播新手主播分析表现并提供建议。基于语音转文本记录(含时间轴、发言人和内容),按以下步骤分析:## 交流改进分析- 分析主播与嘉宾对话: - 话题连贯性和流畅度 - 互动自然程度 - 是否有效引导对话 - 是否适时让嘉宾发挥- 指出改进点: - 话题转换是否生硬 - 是否充分利用嘉宾专长 - 有无未深入探讨的有趣话题 - 是否加入适当幽默- 为每个改进点提供具体建议和示例## 节奏和表现分析- 根据时间轴评估: - 发言频率 - 发言间隔 - 单次发言平均时长- 分析整体表现: - 是否有紧张迹象(如频繁停顿、重复) - 表达欲是否充分(主动引导话题、积极回应嘉宾)- 提供客观评价,用具体数据支持## 原因分析和改进建议- 若发现紧张或表达不足: - 分析原因(如经验不足、准备不充分、话题不熟) - 提供针对性建议: - 直播前准备 - 心态调整技巧 - 提升表达能力的练习 - 更好利用嘉宾资源- 为每项建议给出具体执行步骤或练习方法## 鼓励和正面反馈- 找出主播亮点和进步,给予真诚赞美- 强调“先完成再完美”的正确性,鼓励坚持- 提供激励性话语,增强信心在分析中保持客观、具体和建设性,帮助主播认识优缺点并提供清晰、可执行的建议。若信息不足,指出并基于现有信息给出最佳分析。以下是语音转文本记录的内容:
看完 AI 的分析结果,我觉得是非常非常不错的,比咨询专业的直播更方便、比自己一点点看回放复盘更快,当然这不代表不需要看直播回放来复盘。

如果是演讲的话,那也可以把视频上传发给 AI(别上传时长太长的,控制在 5 分钟以内),再让其分析演讲表现、手势、语调、动作等元素。

有一句名言叫作:
以铜为镜可以正衣冠,以古为镜可以知兴替,以人为镜可以明得失。
现在是:
以 AI 为镜,可以分析你的穿搭(AI 视频通话)、可以指出你的演讲/直播表现的问题并给出建议(上传视频)、可以交流讨论历史周期更替(AI 对话)。