这两天尝试了几款 AI 语音输入法,主要用了 Typeless、智谱、豆包和闪电说。这四款 AI 各有优劣:
1. Typeless
(a) 优势:识别最准确,能将大量的零散语音浓缩为非常精炼的文字输出,特别适合VibeCoding。另外,Typeless也是目前主流AI语音输入法中唯一支持所有端的,Mac、Win、Andriod、iOS都可以,一次注册,全端通用。
(b) 特点:在移动设备上,可以针对已输出的文字,通过语音再次进行修改。比如我说VibeCoding,它输出文字可能识别为 web coding,这时候我可以用语音逐一蹦英文字母的方式纠正全文里的错误。而且它还能记忆这些纠错,越用越智能。
(c) 缺点: 唯一缺点就是贵,单月30刀,包年每月12刀。
2. 豆包
(a) 优势:免费,并且识别输出速度非常快,但也正因如此,它主要针对一小段一小段的文字进行 AI 优化,没有全文逻辑优化的能力。
(b) 特点:没有特别明显的特点。
(c) 缺点:目前没有 PC 端,只有移动端,而且iOS端的能力不如安卓端。
3. 智谱
(a) 优势:免费,有一定的整理逻辑识别能力。
(b) 特点:可以进行人性化设置,比如你把自己设置为英语翻译专家,那你讲中文,它输出就是地道的英文,你要是把自己设置为流氓,它输出都是加了脏话的文字😂
(c) 缺点:智能化程度比 Typeless 差一些,在Win端测试各种环境下使用的时候,经常出现在某些输入框无法正常产生文字的Bug,不知道其它端有没有这个问题。
4. 闪电说
(a) 优势:免费,可以使用本地大模型,识别速度最快,最安全。
(b) 特点:支持各种第三方大模型,不像上面的产品都没啥自主选择权。而且我特别喜欢闪电说用鼠标滚轮触发语音开关的设置,这样就可以彻底解放左手了。进行长时间的语音输入时,我可以右手拿着鼠标离开电脑,这个说不清,用了才知道爽。
(c) 缺点:本地大模型智能是最差的,几乎就是类似之前讯飞那种能力。而且只有PC端,没有移动端,好像也不准备出移动端。
概念纠正:几乎所有的AI语音输入法在PC端其实并不是真正的输入法,只是一个软件,能通过快捷键触发识别语音输入,并最终把文字输出到你当前激活的任何文字输入窗口。你的系统输入法并不会增加一个新的选项,所以并不需要担心全局输入隐私问题。但在移动端就必须是标准输入法了,而且基本都要开全局键盘监听,否则没有云端智能能力。
最后:本推文全文都是用 Typeless 进行的语音输入,只进行了非常轻微的调整和排版。
输入的时候,我其实是一边想一边断断续续的说,整个逻辑也不是特别清晰,基本都是零碎的知识点。但是它在输出时,对我整个输入进行了逻辑优化和格式排版,最终结果就是大家看到的样子,非常牛逼。
所以我最终会选择使用 Typeless。不过我可能不会选年付,而是选择它的季付方案,主要原因是现在 AI 迭代太快了,三个月之后可能会有比 Typeless 更牛逼的产品出来了,搞不好还是免费的😜











































