Member-only story

微信键盘:高准确率语音输入带来的惊喜

你喜欢微信键盘吗?你有更加趁手的输入法吗?

Shuyi Wang
Jan 6, 2023

微信键盘已经发布些日子了。你最近尝试用了没有?测试版的时候,大家说它占的空间太大,而且体积还越用越大。考虑到我的某些设备(低配版 iPad mini)剩余空间不多,所以我当时没有尝试。后来正式版发布了,据说空间问题得到了不小的改善。我于是测试了一下,感觉非常惊喜。这惊喜,主要来自于微信键盘的语音输入功能。

微信虽然不是专门做语音输入的,但是早就提供语音转文字的功能。在微信里面,每天都有许许多多的用户进行语音输入和文本转换。别忘了,用户每次输入、转换和手动调整,都是在给微信做线上训练和反馈。这属于「在线学习」(online learning)的典型例子。微信所拥有的语料和标记数据,规模十分庞大。而对于机器学习来说,架构模型大多是开放的,独特而充足的数据才是真正的竞争优势。

其结果,就是微信键盘的语音输入功能非常惊艳。我尝试的结果,只代表我个人的情况。样本太少,很难给你一个客观公正的量化分析结果。但是对我而言,微信键盘的语音输入比起讯飞,在准确率上有明显的优势。至于比起苹果自带的语音输入,那简直不知道强到哪里去了

值得一提的是,长文写作的时候,口述直接获得文稿,直接发布是不大靠谱的。因为口语稿件和书面语言有显著区别,所以你需要对口语识别稿进行整理。如果稿件足够长,光是这个整理的动作也很让人头疼。幸运的是,有了人工智能的加持,我们不需要完全手动做整理。你可以直接使用 Craft 或者 Notion 的 AI 助手功能,帮助自己快速高效整理稿件。

好消息是如果你不想写长篇文章,使用微信键盘的「语音输入」会更方便适用。例如我现在在 Readwise Reader 和 Kindle 上阅读文章时需要做笔记,会直接拿着 iPad 口述当时的想法。语音录入转文字流畅自然,而且识别率很高,一保存就可以为将来加工整理备用了。

这些内容会随着后台的自动化处理,被放到我的笔记系统中,随时可以被调用。如果你用的是 Readwise ,那么它可以直接同步到 Roam Research, Notion, Obsidian 等。如果你在得到 App 里面写读书笔记,或者知识城邦里发表动态,那么得到 App -> flomo -> Notion…

--

--

Shuyi Wang
Shuyi Wang

Written by Shuyi Wang

PhD in Information Science. Associate Professor at Tianjin Normal University. Former Adjunct Faculty at UNT. First Prize Winner of HackNTX 2018.

No responses yet