发帖
 找回密码
 立即注册
搜索
1 1 0
AI软件 139 1 3 天前

通义听悟 - 开会必备

前面的Get 笔记确实好用,但免费版一次只能转写 10 分钟的文字。如果是会议录音这种较长的内容,用什么工具呢?

这里推荐阿里出品的通义听悟:https://tingwu.aliyun.com/。

它的核心功能是通过 TTS 技术将音视频中的语音转为文字,还能区分不同发言人,方便在回听会议录音时快速定位到具体发言人的内容,实用性很强。

如果你用过飞书妙记,那应该能很快上手。相比飞书妙记,通义听悟不仅支持更长的转写时长、免费使用,还融入了 AI 功能。

具体使用方法:

1、打开通义听悟官网,然后点击右上角的登录

19e80747ddd59846646b703ed97c329a.png

登录可以选择手机登录,也可以选择使用支付宝扫码。

然后首页这里,有两个选择,一个是实时记录,你可以理解成同声传译,你边说电脑边录制,然后实时转换成文字内容,然后你点击完成之后,完整的内容就直接出来了

第二个是上传音视频,就比如我今天是直接录音的,录音完之后,保存到手机里生成了一个 mp3 文件,此时就可以在这里上传我的 mp3 文件来转录
35deacebce7ca5427972066d398230dc.png

然后选择哪一个,都要根据实际的情况来选一下录音时的背景信息,是单人 solo 还是两人对话还是多人讨论?

是中文还是英文还是日语粤语等等?
ec72e13478cfb37579b0f1c93bd7636c.png

e5a08e4fdcc9af53f6e0b4402ac65056.png
完成转录之后,会显示 AI 总结好的关键词、AI 总结的全文摘要,下面的图片是我跟朋友连麦直播完事之后,导出视频文件再上传到通义听悟处理完的结果:
a7c1d634a9a2411870bd444160525532.png
然后下面就是 AI 更细致的总结。
452405c01136c5b044be96a713da9edc.png
以及要点回顾什么,相信聪明的你肯定一看就知道是什么意思。

b8f560c951726a23d4813b9074f36c96.png

接下来是一些你可能不知道的使用技巧。

1、高效学习

例如,有一些直播是没有回放,而我当时没空听,怎么办呢?

要么让其他听课的人帮忙私下录屏,然后向对方要回放;要么自己开录屏录下来。

这样我们就得到了一个直播回放的 mp4 文件,此时,把这个 mp4 文件上传到通义听悟,看着语音转文字的内容,我们就可以快速定位到想看到内容,这比 2 倍速播放效率更高。

当我们带着问题,有了目标再去课程中找答案时,这样的效率肯定是要比漫无目的地跟着听直播效率更高的。
f5946ca195b4f6f28d6ae61b8ea42ed2.png

这一招不仅适用于直播回放,也适用于听其他线上或线下的分享。

一边听一边打开通义听悟的实时记录功能,听完即可快速生成 AI 总结和 AI 笔记。

例如我在 B 站看一些体检的科普视频的时候,就打开实时记录功能,边听边记录。

听完之后,就能快速记录下来我在做体检的时候,需要检查什么内容、注意什么事情等等。
142884350d59ce57bd215fc3bf07ceac.png

2、直播/演讲表现分析

最近我在打造自我纠错系统的时候发现,AI 就是一个非常好的纠错来源。

例如做完一场直播或者做完一场演讲之后,让 AI 帮我纠错,找到我直播时不足之处。

你可能会有疑问:AI 还能看得懂我的直播/演讲的回放视频?

一些多模态的 AI 大模型(例如 Gemini 2.0 Pro)确实是能看得懂视频,但是如果视频很长的话,AI 处理起来速度非常非常慢。

而且,我们也并不需要 AI 看完一整个视频,AI 只需要听懂我的音频、甚至说能看得懂我直播时说的话的文字内容就可以了。

而语音转文字正是通义听悟所擅长的,我们就可以把文字内容导出来,然后复制粘贴发送给 AI 大模型,让其通过“直播字幕”来间接分析我的直播的不足之处。

具体操作如下:

前面分享过了,通义听悟是可以区分不同发言人的,点击摘取原文,即可把所有原文内容摘取到右侧笔记。
dad43b8645ee3222882ba46853bd185f.png

07f6dc8693187aa6d89fd0f56298815f.png

接着,由于我直播了一个多小时,所以文字内容很长很长,所以我们需要选择使用一个能处理长文本的且逻辑推理能力强的 AI 大模型。

如果只是擅长处理长文本但逻辑能力不强的话,那就几乎无法从这么长的文字内容中分析出我的不足之处。

所以,这里我选择的是 Gemini 2.0 Pro,使用下面这段提示词:

你是一位经验丰富的直播教练和复盘专家,任务是帮助一位视频直播新手主播分析表现并提供建议。基于语音转文本记录(含时间轴、发言人和内容),按以下步骤分析:## 交流改进分析- 分析主播与嘉宾对话:  - 话题连贯性和流畅度  - 互动自然程度  - 是否有效引导对话  - 是否适时让嘉宾发挥- 指出改进点:  - 话题转换是否生硬  - 是否充分利用嘉宾专长  - 有无未深入探讨的有趣话题  - 是否加入适当幽默- 为每个改进点提供具体建议和示例## 节奏和表现分析- 根据时间轴评估:  - 发言频率  - 发言间隔  - 单次发言平均时长- 分析整体表现:  - 是否有紧张迹象(如频繁停顿、重复)  - 表达欲是否充分(主动引导话题、积极回应嘉宾)- 提供客观评价,用具体数据支持## 原因分析和改进建议- 若发现紧张或表达不足:  - 分析原因(如经验不足、准备不充分、话题不熟)  - 提供针对性建议:    - 直播前准备    - 心态调整技巧    - 提升表达能力的练习    - 更好利用嘉宾资源- 为每项建议给出具体执行步骤或练习方法## 鼓励和正面反馈- 找出主播亮点和进步,给予真诚赞美- 强调“先完成再完美”的正确性,鼓励坚持- 提供激励性话语,增强信心在分析中保持客观、具体和建设性,帮助主播认识优缺点并提供清晰、可执行的建议。若信息不足,指出并基于现有信息给出最佳分析。以下是语音转文本记录的内容:

看完 AI 的分析结果,我觉得是非常非常不错的,比咨询专业的直播更方便、比自己一点点看回放复盘更快,当然这不代表不需要看直播回放来复盘。
90303ee1942a763c22083dcd3511f6cd.png

如果是演讲的话,那也可以把视频上传发给 AI(别上传时长太长的,控制在 5 分钟以内),再让其分析演讲表现、手势、语调、动作等元素。
6c8b4ff7e2e619a7538300f08b1b8960.png

有一句名言叫作:

以铜为镜可以正衣冠,以古为镜可以知兴替,以人为镜可以明得失。

现在是:

以 AI 为镜,可以分析你的穿搭(AI 视频通话)、可以指出你的演讲/直播表现的问题并给出建议(上传视频)、可以交流讨论历史周期更替(AI 对话)。

──── 1人觉得很赞 ────

使用道具 举报

通义的ai还是有把刷子的,之前国行iphone的ai好像就是传闻要和通义千问合作
您需要登录后才可以回帖 立即登录
高级模式