字
字节笔记本
2026年5月3日
Handy - 免费开源离线语音转文字工具
API中转
¥120
一款免费、开源、可扩展的完全离线语音转文字桌面应用,基于 Tauri 构建,支持跨平台使用。
项目简介
Handy 是一个跨平台桌面应用程序,使用 Tauri(Rust + React/TypeScript)构建,提供简单、注重隐私的语音转录功能。
核心理念: Handy 不是要做最好的语音转文字应用,而是要做最可扩展的一个。
核心特性
| 特性 | 说明 |
|---|---|
| 完全离线 | 所有处理在本地完成,语音数据不发送到云端 |
| 开源免费 | 完全开源,可自行扩展和贡献 |
| 隐私优先 | 声音数据保留在本地计算机上 |
| 简单易用 | 一键转录,快捷键触发,直接粘贴到任何文本框 |
| 跨平台 | 支持 macOS、Windows、Linux |
| 可扩展 | 支持自定义模型和插件 |
技术亮点
- Whisper 模型: 支持 Small/Medium/Turbo/Large 四种规格,GPU 加速
- Parakeet V3: CPU 优化模型,自动语言检测
- 静音过滤: 使用 VAD (Voice Activity Detection) 配合 Silero
- 推谈模式: 连续录音转文字
- 全局快捷键: 系统级快捷键控制
- Tauri v2: 使用最新的 Tauri 2.0 框架构建
工作原理
- 按下快捷键 开始/停止录音(或使用推谈模式)
- 说话,快捷键激活时
- 释放 后 Handy 使用 Whisper 处理语音
- 获得 转录文本直接粘贴到当前应用
技术栈:
- 前端: React + TypeScript + Tailwind CSS
- 后端: Rust (系统集成、音频处理、ML 推理)
- 核心库: whisper-rs, transcription-rs, cpal, vad-rs, rdev, rubato
安装与使用
macOS
bash
brew install --cask handy通用安装
- 从 Releases 页面 或 官网 下载
- 安装应用程序
- 启动 Handy 并授予系统权限(麦克风、无障碍)
- 在设置中配置快捷键
- 开始转录!
系统要求
Whisper 模型:
- macOS: M 系列芯片或 Intel
- Windows: Intel、AMD 或 NVIDIA GPU
- Linux: Intel、AMD 或 NVIDIA GPU
Parakeet V3 模型:
- CPU 操作即可
- 性能: ~5x 实时速度(i5 测试)
适用场景
- 无障碍辅助工具(听障人士)
- 隐私敏感的语音转录
- 离线环境使用
- 开发者和技术人员自定义扩展
- 多语言语音识别(自动检测 90+ 语言)
相关链接
- GitHub 仓库: https://github.com/cjpais/Handy
- 官网: https://handy.computer
在 AI 技术快速迭代的今天,保持持续学习的能力比掌握任何特定的技术都更重要。理解底层原理可以帮助你在遇到新技术时更快地上手,可以在不同的技术方案之间做出更明智的选择。建议开发者建立自己的技术框架,而不是追逐每一个新的工具和框架。实践是最好的学习方式,在真实项目中应用新学到的技术,遇到问题并解决,这种经历比任何教程都更有价值。定期整理和复盘也是很好的习惯。将学到的知识归档整理,形成自己的知识库。当需要用到某个技术时,可以直接从自己的知识库中找到相关的参考,而不是从零开始搜索。
分享: