Member-only story
如何用语音记临时笔记?
Photo by Jason Rosewell on Unsplash
看到这个标题,你可能会有些茫然。这都快 2022 年了,还有人不知道语音输入文字功能吗?
没错,语音输入转文字,确实不是什么新奇的事儿。我在 之前的文章和视频里,也多次给你介绍过一系列的工具。
它们来自于讯飞、腾讯、苹果等平台。可以用超过97%的正确率,帮助你快速把头脑中想到的内容,语音输入轻松弄成文本。
好用不好用?
不能说不好用,否则那些自带语音输入功能的鼠标,不会卖得这么火。
但也不能说足够好用,否则键盘的销量,早就该跌得一塌糊涂了。
实际上,更多人还是倾向于使用键盘来输入。注意我说的,不是后期编辑加工,而是从一开始做记录,就用键盘而非语音。
为什么?
因为目前的语音输入,至少包含了以下 3 个痛点:
首先,我们的书面表达方式,和口语有区别。你可能十分钟说了2000字,但审视文本,发现过于口语化 — — 中间有很多冗余,甚至逻辑关系上也有问题。要弄成可以给对方(尤其是重要客户)看的书面表达形式,需要整上个半小时。与其那样,似乎还不如一上来就码字儿来得直接、方便和快速。
其次,语音识别的准确率,毕竟离100%还差着一点儿。这其实完全可以理解。即便是人听人说话,而且是母语,也难有100%的准确率。指导过学生毕业论文的老师们,或者带过实习生的职场人士,对此应该不乏深刻体会。准确率不到100%,就意味着必须进行审视和检查。当你输入语音时,盯着屏幕上不断出现的错字儿,你说咋办?不管,怕一会儿忘了;管,思路就断了……
第三,你是输入完毕了,可是上下文(语音),就被丢弃了。你可能认为,既然目标是要输入文字,语音丢了就丢了呗。就如同大楼盖好,为啥还要留着脚手架呢?可别忘了,一个最终的长文本,大都不是一天内写好的。最终整理的时候,你会发现识别的结果不像人话,肯定是某些关键词汇识别错误,但是时间久了,你已经想不起来当初说的是啥了。这情何以堪?
因而,受目前技术所限,一种比较好的语音录入流程,应该包含以下几个必要功能的考虑:
首先,存储语音,不要随意丢弃。这样将来发现有识别错误,可以找到原始语音。人工听几秒钟,立刻就能知道最初的准确含义。