用过后回不去——AI语音输入法

AI语音输入法，可以说是目前我最喜欢用的AI产品之一，比如这段话就是我用语音输入的。

在最开始我用 AI 语音输入法的时候，我在想:手机上不是已经有了内置的语音输入嘛，为什么还要加个 AI 呢？但渐渐的我发现事情没那么简单。

1.它的准确率比内置的语音输入准确率高太多太多了。举个例子。比如这段话：

“一个好的 prompt 对于 AI 来说真的很重要，它可以很大的 amplify AI 的能力，以及…给AI 更多的 context。于是我们可以，于是他们生成结果的 accuracy会得到很大提高。Hallucination也会大大减小。 ”

如果是传统的语音输入，它可能不仅识别不到英文，可能反而还会把英文识别成离谱的中文。但如果ai语音识别模型优秀，它就能完全get到你想表达的意思。比如上面引号里的这段话，我不仅一个字都没有修改，甚至标点都是它帮我加的，Incredible。

（目前最顶尖的是Elevenlabs的Scribe v2，上面这段话用的Scribe v1，已经准确的吓人了，OpenAI的也不错，就是它经常忘记加标点）

2.因为是 AI 处理，所以你还可以添加自己的专属词库。比如我要给我的视频上字幕，我会有一个专门的 AI 字幕师的 prompt，里面就包含了我常用的口癖（例如“哎呦”“hoi”“嘞”），还有空洞骑士里的一些专有名词，于是那个 AI 的模型就能 get 到我的意思，最终结果准确率会提升很多，而不需要我一个个去改了。

3.由于速度和准确率大幅提升，这就相当于你输出的带宽增加了。放在以前，如果我要在手机上用 AI 一个问题，我需要输入大量的文字，这个过程是很痛苦的。但是有了 AI 语音输入法之后，我可以像聊天一样把我遇到的问题，还有所有的 context 都给它表述清楚，整个过程水到渠成！

OK，说了这么多，请放心，我不是传销组织，我只是真的被这类产品给惊讶到了，并且很大的提高了我的输出效率，因此十分推荐。

目前我在用的软件：

Mac端：Spokenly, Wispr Flow
Windows端：Wispr Flow
iOS：Spokenly, Wispr Flow

个人更推荐 Spokenly，有更多的模型可以选，同时集成了各种第三方api和本地模型可供选择，很多api服务商有提供免费额度，同时该软件给出了获取api key的链接，非常方便，可以试试看。

2026.2.14 更新

Typeless 这个 App 变成了现在的上位替代，非常推荐。优势有：

功能丰富
(a) 可以直接通过语音进行编辑、问问题并得到回复
(b) 拥有翻译功能，which is very convenient
多平台支持
支持安卓、iOS、macOS 以及 Windows 平台

比如你看到的上面这一段话，从 Typeless 到最后的 Windows 平台，这样一整段话仅仅是通过我语音输入，然后这个软件自动帮我完成的吗？

包括这些分点（1、2、3 还有 a、b、c）、括号里的内容，以及分段和冒号，这些都是它自己完成的。所以我在第一次用它的时候，着实是吓了一跳。包括这句话也是通过这个软件语音输入的，我没有手动去敲 1、2、3，A、B、C 还有括号。我做的唯一一件事情，就是按下按钮说话，然后结束。

About this Post

This post is written by Nosky, licensed under CC BY-NC 4.0.

#AI

用过后回不去——AI语音输入法

About this Post

保持敬畏

记录一次攀岩