ByteNoteByteNote

字节笔记本

2026年5月3日

Handy - 免费开源离线语音转文字工具

API中转
¥120

一款免费、开源、可扩展的完全离线语音转文字桌面应用,基于 Tauri 构建,支持跨平台使用。

项目简介

Handy 是一个跨平台桌面应用程序,使用 Tauri(Rust + React/TypeScript)构建,提供简单、注重隐私的语音转录功能。

核心理念: Handy 不是要做最好的语音转文字应用,而是要做最可扩展的一个。

核心特性

特性说明
完全离线所有处理在本地完成,语音数据不发送到云端
开源免费完全开源,可自行扩展和贡献
隐私优先声音数据保留在本地计算机上
简单易用一键转录,快捷键触发,直接粘贴到任何文本框
跨平台支持 macOS、Windows、Linux
可扩展支持自定义模型和插件

技术亮点

  • Whisper 模型: 支持 Small/Medium/Turbo/Large 四种规格,GPU 加速
  • Parakeet V3: CPU 优化模型,自动语言检测
  • 静音过滤: 使用 VAD (Voice Activity Detection) 配合 Silero
  • 推谈模式: 连续录音转文字
  • 全局快捷键: 系统级快捷键控制
  • Tauri v2: 使用最新的 Tauri 2.0 框架构建

工作原理

  1. 按下快捷键 开始/停止录音(或使用推谈模式)
  2. 说话,快捷键激活时
  3. 释放 后 Handy 使用 Whisper 处理语音
  4. 获得 转录文本直接粘贴到当前应用

技术栈:

  • 前端: React + TypeScript + Tailwind CSS
  • 后端: Rust (系统集成、音频处理、ML 推理)
  • 核心库: whisper-rs, transcription-rs, cpal, vad-rs, rdev, rubato

安装与使用

macOS

bash
brew install --cask handy

通用安装

  1. Releases 页面官网 下载
  2. 安装应用程序
  3. 启动 Handy 并授予系统权限(麦克风、无障碍)
  4. 在设置中配置快捷键
  5. 开始转录!

系统要求

Whisper 模型:

  • macOS: M 系列芯片或 Intel
  • Windows: Intel、AMD 或 NVIDIA GPU
  • Linux: Intel、AMD 或 NVIDIA GPU

Parakeet V3 模型:

  • CPU 操作即可
  • 性能: ~5x 实时速度(i5 测试)

适用场景

  • 无障碍辅助工具(听障人士)
  • 隐私敏感的语音转录
  • 离线环境使用
  • 开发者和技术人员自定义扩展
  • 多语言语音识别(自动检测 90+ 语言)

相关链接

在 AI 技术快速迭代的今天,保持持续学习的能力比掌握任何特定的技术都更重要。理解底层原理可以帮助你在遇到新技术时更快地上手,可以在不同的技术方案之间做出更明智的选择。建议开发者建立自己的技术框架,而不是追逐每一个新的工具和框架。实践是最好的学习方式,在真实项目中应用新学到的技术,遇到问题并解决,这种经历比任何教程都更有价值。定期整理和复盘也是很好的习惯。将学到的知识归档整理,形成自己的知识库。当需要用到某个技术时,可以直接从自己的知识库中找到相关的参考,而不是从零开始搜索。

分享: