ByteNoteByteNote

字节笔记本

2026年5月3日

Claude Code 硬核上线语音功能!AI编程正式进入"口喷时代"

API中转
¥120

Anthropic 官方宣布 Claude Code 语音模式全面开启灰度推送,AI编程进入"口喷时代"。语音输入速度(150词/分钟)是打字速度(40词/分钟)的3-4倍,大幅提升编程效率。

痛点分析

很多时候阻碍我们写代码的不是逻辑不够清晰,而是打字速度远远跟不上脑子的转速。

尤其是对于中文用户,还要面临中英切换、选词标点删除等问题。可以说输入和表达成为了 AI 编程的最短的那个板。

一般而言打字极限往往只有四十个词,而说话的速度大约是每分钟一百五十个词。这中间三到四倍的效率差,就是语音编程要降维打击的战场。

无论是吃东西、手腕酸痛,还是单纯的思路枯竭不想敲击键盘,语音输入都是解放生产力的绝对刚需。

Claude Code 语音功能

Claude Code 语音模式目前还处于灰度推送中,更新到最新版本的 Claude Code,输入 /voice 命令,按住空格键开始说话,松开空格,语音会瞬间变成文字,精准插入光标所在的位置。

核心优势

  • 完全免费: 所有语音转录的 Token 消耗完全免费,根本不计入调用额度中
  • 操作简单: 输入 /voice 命令,按住空格键说话,松开即转文字
  • 精准插入: 语音转文字后精准插入光标所在位置

当前限制

官方 Claude Code 目前只支持少部分的语言,不包含中文语言

替代方案:ASRO

对于中文用户,可以使用 ASRO 作为替代方案。ASRO 基于千问推出的 ASR 模型,封装打包为语音输入桌面应用。

技术特点

  • 完全离线: 不依赖网络连接,所有处理在本地完成
  • 0 延时: 相较于市面上的语音输入应用,延时更低
  • 隐私保护: 所有对话不会被传到云端
  • 模型高效: 使用 Qwen3-ASR 0.6B 模型,虽然只有 0.6B,但语音识别转录速度极其高效准确,尤其对中文语音处理
  • 后置优化: 支持纯本地部署 ollama 和 qwen 模型,处理口头禅、修复标点符号

应用场景

  • 手腕酸痛时使用
  • 边吃东西边编程
  • 思路枯竭不想敲键盘
  • 需要隔离环境的开发场景

语音输入工具对比

工具优势劣势
Claude Code 语音免费、官方支持暂无中文支持
ASRO离线、0延时、中文支持好需本地部署
Speakly云端服务、即开即用延时、掉包、隐私问题
豆包输入法微信文章编辑方便依赖云端

未来展望

语音输入在今年也会成为各家的必争之地,进一步提升 AI 编程的人机交互的自然度。

ASRO 后期也会加入更多的语音相关功能,比如 Agent 模式、语句联想以及截屏场景等功能。


原文链接: https://mp.weixin.qq.com/s/7_yJaZ9w1F2fLswm427ZYQ 发布时间: 2026年3月4日

Claude 系列模型在长上下文和安全性方面有独特的优势。200K 的上下文窗口让 Claude 可以一次性处理整本小说或完整的代码库,大幅减少了多轮交互的需求。Claude Code 作为 CLI 编程助手,提供了和 Cursor、GitHub Copilot 不同的交互体验,更加适合熟悉终端的开发者使用。Sonnet 模型在速度和质量的平衡上表现很好,适合作为日常开发的主力模型。Opus 模型追求极致的质量,适合处理复杂推理和创意任务。Anthropic 对模型安全的重视也值得关注,通过宪法 AI 等技术手段让模型更安全、更可控。对于企业用户来说,Claude 的安全特性和可解释性是选择的重要因素。

分享: