AI语音输入法,可以说是目前我最喜欢用的AI产品之一,比如这段话就是我用语音输入的。
在最开始我用 AI 语音输入法的时候,我在想:手机上不是已经有了内置的语音输入嘛,为什么还要加个 AI 呢? 但渐渐的我发现事情没那么简单。
1.它的准确率比内置的语音输入准确率高太多太多了。举个例子。比如这段话:
“一个好的 prompt 对于 AI 来说真的很重要,它可以很大的 amplify AI 的能力,以及…给AI 更多的 context。于是我们可以,于是他们生成结果的 accuracy会得到很大提高。Hallucination也会大大减小。 ”
如果是传统的语音输入,它可能不仅识别不到英文,可能反而还会把英文识别成离谱的中文。 但如果ai语音识别模型优秀,它就能完全get到你想表达的意思。比如上面引号里的这段话,我不仅一个字都没有修改,甚至标点都是它帮我加的,Incredible。
(目前最顶尖的是Elevenlabs的Scribe v2,上面这段话用的Scribe v1,已经准确的吓人了,OpenAI的也不错,就是它经常忘记加标点)
2.因为是 AI 处理,所以你还可以添加自己的专属词库。比如我要给我的视频上字幕,我会有一个专门的 AI 字幕师的 prompt,里面就包含了我常用的口癖(例如“哎呦”“hoi”“嘞”),还有空洞骑士里的一些专有名词,于是那个 AI 的模型就能 get 到我的意思,最终结果准确率会提升很多,而不需要我一个个去改了。
3.由于速度和准确率大幅提升,这就相当于你输出的带宽增加了。放在以前,如果我要在手机上用 AI 一个问题,我需要输入大量的文字,这个过程是很痛苦的。但是有了 AI 语音输入法之后,我可以像聊天一样把我遇到的问题,还有所有的 context 都给它表述清楚,整个过程水到渠成!
OK,说了这么多,请放心,我不是传销组织,我只是真的被这类产品给惊讶到了,并且很大的提高了我的输出效率,因此十分推荐。
目前我在用的软件:
Mac端:Spokenly, Wispr Flow
Windows端:Wispr Flow
iOS:Spokenly, Wispr Flow
个人更推荐 Spokenly,有更多的模型可以选,同时集成了各种第三方api和本地模型可供选择,很多api服务商有提供免费额度,同时该软件给出了获取api key的链接,非常方便,可以试试看。
2026.2.14 更新
Typeless 这个 App 变成了现在的上位替代,非常推荐。优势有:
-
核心能力出色
(a) 准确率高
(b) 格式化与断行处理得很好
© 对 context(上下文)的理解远胜于其他软件 -
功能丰富
(a) 可以直接通过语音进行编辑、问问题并得到回复
(b) 拥有翻译功能,which is very convenient -
多平台支持
支持安卓、iOS、macOS 以及 Windows 平台
比如你看到的上面这一段话,从 Typeless 到最后的 Windows 平台,这样一整段话仅仅是通过我语音输入,然后这个软件自动帮我完成的吗?
包括这些分点(1、2、3 还有 a、b、c)、括号里的内容,以及分段和冒号,这些都是它自己完成的。所以我在第一次用它的时候,着实是吓了一跳。包括这句话也是通过这个软件语音输入的,我没有手动去敲 1、2、3,A、B、C 还有括号。我做的唯一一件事情,就是按下按钮说话,然后结束。
About this Post
This post is written by Nosky, licensed under CC BY-NC 4.0.