微信键盘:高准确率语音输入带来的惊喜

你喜欢微信键盘吗?你有更加趁手的输入法吗?

Shuyi Wang
Jan 6, 2023

微信键盘已经发布些日子了。你最近尝试用了没有?测试版的时候,大家说它占的空间太大,而且体积还越用越大。考虑到我的某些设备(低配版 iPad mini)剩余空间不多,所以我当时没有尝试。后来正式版发布了,据说空间问题得到了不小的改善。我于是测试了一下,感觉非常惊喜。这惊喜,主要来自于微信键盘的语音输入功能。

微信虽然不是专门做语音输入的,但是早就提供语音转文字的功能。在微信里面,每天都有许许多多的用户进行语音输入和文本转换。别忘了,用户每次输入、转换和手动调整,都是在给微信做线上训练和反馈。这属于「在线学习」(online learning)的典型例子。微信所拥有的语料和标记数据,规模十分庞大。而对于机器学习来说,架构模型大多是开放的,独特而充足的数据才是真正的竞争优势。

其结果,就是微信键盘的语音输入功能非常惊艳。我尝试的结果,只代表我个人的情况。样本太少,很难给你一个客观公正的量化分析结果。但是对我而言,微信键盘的语音输入比起讯飞,在准确率上有明显的优势。至于比起苹果自带的语音输入,那简直不知道强到哪里去了

值得一提的是,长文写作的时候,口述直接获得文稿,直接发布是不大靠谱的。因为口语稿件和书面语言有显著区别,所以你需要对口语识别稿进行整理。如果稿件足够长,光是这个整理的动作也很让人头疼。幸运的是,有了人工智能的加持,我们不需要完全手动做整理。你可以直接使用 Craft 或者 Notion 的 AI 助手功能,帮助自己快速高效整理稿件。

好消息是如果你不想写长篇文章,使用微信键盘的「语音输入」会更方便适用。例如我现在在 Readwise Reader 和 Kindle 上阅读文章时需要做笔记,会直接拿着 iPad 口述当时的想法。语音录入转文字流畅自然,而且识别率很高,一保存就可以为将来加工整理备用了。

这些内容会随着后台的自动化处理,被放到我的笔记系统中,随时可以被调用。如果你用的是 Readwise ,那么它可以直接同步到 Roam Research, Notion, Obsidian 等。如果你在得到 App 里面写读书笔记,或者知识城邦里发表动态,那么得到 App -> flomo -> Notion…

--

--

Shuyi Wang

PhD in Information Science. Associate Professor at Tianjin Normal University. Former Adjunct Faculty at UNT. First Prize Winner of HackNTX 2018.