字节笔记本
2026年5月3日
Claude Code 硬核上线语音功能!AI编程正式进入"口喷时代"
Anthropic 官方宣布 Claude Code 语音模式全面开启灰度推送,AI编程进入"口喷时代"。语音输入速度(150词/分钟)是打字速度(40词/分钟)的3-4倍,大幅提升编程效率。
痛点分析
很多时候阻碍我们写代码的不是逻辑不够清晰,而是打字速度远远跟不上脑子的转速。
尤其是对于中文用户,还要面临中英切换、选词标点删除等问题。可以说输入和表达成为了 AI 编程的最短的那个板。
一般而言打字极限往往只有四十个词,而说话的速度大约是每分钟一百五十个词。这中间三到四倍的效率差,就是语音编程要降维打击的战场。
无论是吃东西、手腕酸痛,还是单纯的思路枯竭不想敲击键盘,语音输入都是解放生产力的绝对刚需。
Claude Code 语音功能
Claude Code 语音模式目前还处于灰度推送中,更新到最新版本的 Claude Code,输入 /voice 命令,按住空格键开始说话,松开空格,语音会瞬间变成文字,精准插入光标所在的位置。
核心优势
- 完全免费: 所有语音转录的 Token 消耗完全免费,根本不计入调用额度中
- 操作简单: 输入
/voice命令,按住空格键说话,松开即转文字 - 精准插入: 语音转文字后精准插入光标所在位置
当前限制
官方 Claude Code 目前只支持少部分的语言,不包含中文语言。
替代方案:ASRO
对于中文用户,可以使用 ASRO 作为替代方案。ASRO 基于千问推出的 ASR 模型,封装打包为语音输入桌面应用。
技术特点
- 完全离线: 不依赖网络连接,所有处理在本地完成
- 0 延时: 相较于市面上的语音输入应用,延时更低
- 隐私保护: 所有对话不会被传到云端
- 模型高效: 使用 Qwen3-ASR 0.6B 模型,虽然只有 0.6B,但语音识别转录速度极其高效准确,尤其对中文语音处理
- 后置优化: 支持纯本地部署 ollama 和 qwen 模型,处理口头禅、修复标点符号
应用场景
- 手腕酸痛时使用
- 边吃东西边编程
- 思路枯竭不想敲键盘
- 需要隔离环境的开发场景
语音输入工具对比
| 工具 | 优势 | 劣势 |
|---|---|---|
| Claude Code 语音 | 免费、官方支持 | 暂无中文支持 |
| ASRO | 离线、0延时、中文支持好 | 需本地部署 |
| Speakly | 云端服务、即开即用 | 延时、掉包、隐私问题 |
| 豆包输入法 | 微信文章编辑方便 | 依赖云端 |
未来展望
语音输入在今年也会成为各家的必争之地,进一步提升 AI 编程的人机交互的自然度。
ASRO 后期也会加入更多的语音相关功能,比如 Agent 模式、语句联想以及截屏场景等功能。
原文链接: https://mp.weixin.qq.com/s/7_yJaZ9w1F2fLswm427ZYQ 发布时间: 2026年3月4日
Claude 系列模型在长上下文和安全性方面有独特的优势。200K 的上下文窗口让 Claude 可以一次性处理整本小说或完整的代码库,大幅减少了多轮交互的需求。Claude Code 作为 CLI 编程助手,提供了和 Cursor、GitHub Copilot 不同的交互体验,更加适合熟悉终端的开发者使用。Sonnet 模型在速度和质量的平衡上表现很好,适合作为日常开发的主力模型。Opus 模型追求极致的质量,适合处理复杂推理和创意任务。Anthropic 对模型安全的重视也值得关注,通过宪法 AI 等技术手段让模型更安全、更可控。对于企业用户来说,Claude 的安全特性和可解释性是选择的重要因素。