Member-only story

如何用语音记临时笔记?

Shuyi Wang
Dec 9, 2021

--

Photo by Jason Rosewell on Unsplash

看到这个标题,你可能会有些茫然。这都快 2022 年了,还有人不知道语音输入文字功能吗?

没错,语音输入转文字,确实不是什么新奇的事儿。我在 之前的文章和视频里,也多次给你介绍过一系列的工具。

它们来自于讯飞、腾讯、苹果等平台。可以用超过97%的正确率,帮助你快速把头脑中想到的内容,语音输入轻松弄成文本。

好用不好用?

不能说不好用,否则那些自带语音输入功能的鼠标,不会卖得这么火。

但也不能说足够好用,否则键盘的销量,早就该跌得一塌糊涂了。

实际上,更多人还是倾向于使用键盘来输入。注意我说的,不是后期编辑加工,而是从一开始做记录,就用键盘而非语音。

为什么?

因为目前的语音输入,至少包含了以下 3 个痛点:

首先,我们的书面表达方式,和口语有区别。你可能十分钟说了2000字,但审视文本,发现过于口语化 — — 中间有很多冗余,甚至逻辑关系上也有问题。要弄成可以给对方(尤其是重要客户)看的书面表达形式,需要整上个半小时。与其那样,似乎还不如一上来就码字儿来得直接、方便和快速。

其次,语音识别的准确率,毕竟离100%还差着一点儿。这其实完全可以理解。即便是人听人说话,而且是母语,也难有100%的准确率。指导过学生毕业论文的老师们,或者带过实习生的职场人士,对此应该不乏深刻体会。准确率不到100%,就意味着必须进行审视和检查。当你输入语音时,盯着屏幕上不断出现的错字儿,你说咋办?不管,怕一会儿忘了;管,思路就断了……

第三,你是输入完毕了,可是上下文(语音),就被丢弃了。你可能认为,既然目标是要输入文字,语音丢了就丢了呗。就如同大楼盖好,为啥还要留着脚手架呢?可别忘了,一个最终的长文本,大都不是一天内写好的。最终整理的时候,你会发现识别的结果不像人话,肯定是某些关键词汇识别错误,但是时间久了,你已经想不起来当初说的是啥了。这情何以堪?

因而,受目前技术所限,一种比较好的语音录入流程,应该包含以下几个必要功能的考虑:

首先,存储语音,不要随意丢弃。这样将来发现有识别错误,可以找到原始语音。人工听几秒钟,立刻就能知道最初的准确含义。

--

--

Shuyi Wang
Shuyi Wang

Written by Shuyi Wang

PhD in Information Science. Associate Professor at Tianjin Normal University. Former Adjunct Faculty at UNT. First Prize Winner of HackNTX 2018.

No responses yet