字
字节笔记本
2026年2月16日
Pindrop:原生 macOS 离线 AI 听写应用
本文介绍 Pindrop,一个原生 macOS 菜单栏听写应用,使用本地语音转文字技术,基于 WhisperKit 实现完全离线、完全隐私的语音输入体验。
项目简介
Pindrop 是一个开源的 macOS 听写应用,由 watzon 开发维护。截至目前,该项目在 GitHub 上已获得 224 stars。它是目前唯一 100% 开源、真正原生 Mac 体验的 AI 听写应用。
与其他听写应用在隐私、性能或平台原生性上妥协不同,Pindrop 专为拒绝妥协的 Mac 用户设计。
核心特性
四大支柱
| 支柱 | 说明 |
|---|---|
| 🍎 Mac-Native | 纯 Swift/SwiftUI 开发,不是 Web 封装。感觉就像 Apple 官方出品 |
| 🔒 Privacy-First | 100% 本地转录,你的声音永远不会离开 Mac |
| ⚡ Apple Silicon 优化 | WhisperKit + Core ML = 在 M 系列芯片上比通用 Whisper 快 2-3 倍 |
| 🏆 100% 开源 | 没有免费增值层,没有"Pro"功能,没有锁定 |
功能列表
- 100% 本地转录 — 使用 OpenAI Whisper 模型通过 WhisperKit 完全在 Mac 上运行
- 全局热键 — 切换模式(按一下开始,按一下停止)或按键说话,在 macOS 任何地方都有效
- 智能输出 — 文本自动复制到剪贴板,可选择直接插入光标位置
- 转录历史 — 所有听写内容本地保存,支持完整搜索,可导出 JSON、CSV 或纯文本
- 多模型尺寸 — 从 Tiny(最快)到 Large(最准确)根据需求选择
- AI 增强(可选) — 使用任何 OpenAI 兼容 API 清理转录文本,默认关闭
- 自定义词典 — 定义自定义词汇替换,提高专有名词、术语的转录准确性
- 精美 macOS 设计 — 原生 SwiftUI 界面,与 Mac 完美融合
技术栈
- Swift — Apple 的现代、快速、安全编程语言
- SwiftUI — 声明式 UI 框架,真正的原生 Mac 应用
- WhisperKit — Argmax, Inc. 提供的高性能 Core ML 版 OpenAI Whisper
- SwiftData — 现代数据持久化框架
- 仅一个外部依赖 — WhisperKit,其他都是 Apple 第一方框架
竞品对比
| 特性 | Pindrop | Handy | OpenWhispr |
|---|---|---|---|
| 平台 | macOS only | Windows, macOS, Linux | Windows, macOS, Linux |
| 框架 | Swift/SwiftUI (原生) | Tauri (Rust + Web) | Tauri (Rust + Web) |
| ML 引擎 | WhisperKit (Apple Core ML) | Generic Whisper | Generic Whisper |
| Apple Silicon | 原生优化 | 模拟运行 | 模拟运行 |
| 源代码 | 100% 开源 | 100% 开源 | 免费增值(付费"Lazy Edition") |
| 电池影响 | 最小(原生) | 较高(Web 运行时) | 较高(Web 运行时) |
| 菜单栏设计 | 一流原生体验 | Web 界面 | Web 界面 |
结论:如果你想在 Mac 上获得最佳的听写体验——最大速度、最小电池消耗、真正的原生感觉——Pindrop 是唯一选择。
系统要求
- macOS 14.0 (Sonoma) 或更高版本
- Apple Silicon (M1/M2/M3/M4) 推荐以获得最佳性能
- 麦克风访问权限(录音必需)
- 辅助功能权限(可选,启用直接文本插入;剪贴板无需此权限)
安装指南
下载安装
由于 Pindrop 目前作为自签名构建分发,首次启动需要批准:
- 从 releases 页面 下载
Pindrop.dmg - 打开 DMG 并将 Pindrop 拖到 Applications
- 首次启动:右键 Pindrop → 打开
- 如果看到"无法打开,因为无法验证开发者":
- 打开系统设置 → 隐私与安全
- 滚动到"安全"部分
- 点击 Pindrop 旁边的"仍要打开"
- 输入密码
从源码构建
bash
# 克隆仓库
git clone https://github.com/watzon/pindrop.git
cd pindrop
# 在 Xcode 中打开
open Pindrop.xcodeproj
# 构建并运行(Cmd+R)使用构建系统(推荐)
bash
# 安装 just
brew install just
# 常用命令
just build # 开发构建(Debug)
just build-release # 发布构建
just test # 运行测试
just dmg-self-signed # 构建 + 创建自签名 DMG
just clean # 清理构建产物
# 发布命令(维护者)
just release 1.5.5 # 升级版本、提交、打标签、推送 → 触发 CI使用指南
首次启动
- 授予麦克风权限 — 录音必需
- 下载模型 — 从"Tiny"开始获得最快体验(约 75MB)
- 设置热键 — 默认 Option+Space 切换模式
- 开始使用 — 按下热键开始听写
录音模式
切换模式(默认:Option+Space)
- 按一下开始录音(菜单栏图标变红)
- 再按一下停止并转录
- 转录文本立即出现在剪贴板
按键说话
- 按住热键录音
- 松开停止并转录
- 在设置 → 热键中配置不同热键
模型选择
| 模型 | 大小 | 速度 | 准确性 |
|---|---|---|---|
| Tiny | ~75 MB | 最快 | 良好 |
| Base | ~150 MB | 快 | 良好 |
| Small | ~500 MB | 中等 | 更好 |
| Medium | ~1.5 GB | 较慢 | 高 |
| Large | ~3 GB | 最慢 | 最高 |
日常使用从 Tiny 或 Base 开始,需要最大准确性时切换到 Medium 或 Large。
AI 增强
- 切换 AI 文本清理开/关
- 输入任何 OpenAI 兼容 API 端点
- API 密钥安全存储在 macOS 钥匙串中,而非 UserDefaults
项目链接
分享: