Member-only story

如何用语音记临时笔记？

Shuyi Wang

Dec 9, 2021

Photo by Jason Rosewell on Unsplash

看到这个标题，你可能会有些茫然。这都快 2022 年了，还有人不知道语音输入文字功能吗？

没错，语音输入转文字，确实不是什么新奇的事儿。我在之前的文章和视频里，也多次给你介绍过一系列的工具。

它们来自于讯飞、腾讯、苹果等平台。可以用超过97%的正确率，帮助你快速把头脑中想到的内容，语音输入轻松弄成文本。

好用不好用？

不能说不好用，否则那些自带语音输入功能的鼠标，不会卖得这么火。

但也不能说足够好用，否则键盘的销量，早就该跌得一塌糊涂了。

实际上，更多人还是倾向于使用键盘来输入。注意我说的，不是后期编辑加工，而是从一开始做记录，就用键盘而非语音。

为什么？

因为目前的语音输入，至少包含了以下 3 个痛点：

首先，我们的书面表达方式，和口语有区别。你可能十分钟说了2000字，但审视文本，发现过于口语化 — — 中间有很多冗余，甚至逻辑关系上也有问题。要弄成可以给对方（尤其是重要客户）看的书面表达形式，需要整上个半小时。与其那样，似乎还不如一上来就码字儿来得直接、方便和快速。

其次，语音识别的准确率，毕竟离100%还差着一点儿。这其实完全可以理解。即便是人听人说话，而且是母语，也难有100%的准确率。指导过学生毕业论文的老师们，或者带过实习生的职场人士，对此应该不乏深刻体会。准确率不到100%，就意味着必须进行审视和检查。当你输入语音时，盯着屏幕上不断出现的错字儿，你说咋办？不管，怕一会儿忘了；管，思路就断了……

第三，你是输入完毕了，可是上下文（语音），就被丢弃了。你可能认为，既然目标是要输入文字，语音丢了就丢了呗。就如同大楼盖好，为啥还要留着脚手架呢？可别忘了，一个最终的长文本，大都不是一天内写好的。最终整理的时候，你会发现识别的结果不像人话，肯定是某些关键词汇识别错误，但是时间久了，你已经想不起来当初说的是啥了。这情何以堪？

因而，受目前技术所限，一种比较好的语音录入流程，应该包含以下几个必要功能的考虑：

首先，存储语音，不要随意丢弃。这样将来发现有识别错误，可以找到原始语音。人工听几秒钟，立刻就能知道最初的准确含义。

如何用语音记临时笔记？

Written by Shuyi Wang

No responses yet