字
字节笔记本
2026年2月26日
iVoco 产品使用说明
iVoco 是一款 macOS 菜单栏语音转文字应用,支持使用 OpenAI 兼容 API(如 OpenAI、Groq 等)或本地 Qwen 模型进行语音转录。只需按住快捷键说话,松开即可自动将语音转换为文字并粘贴到当前光标位置。
系统要求
- macOS 13.0 或更高版本
- 需要麦克风权限、无障碍权限和屏幕录制权限
首次使用
1. 安装与启动
- 下载 iVoco.dmg 并拖拽到应用程序文件夹
- 首次启动时,系统会提示授予必要权限
- iVoco 启动后会在菜单栏显示图标(🎤)
2. 配置 API 密钥
使用 OpenAI API(推荐)
- 点击菜单栏 iVoco 图标 → "设置..."
- 在"转录配置"标签页中:
- API 基础 URL:
https://api.openai.com/v1 - 输入你的 OpenAI API 密钥
- 转录模型:
whisper-1
- API 基础 URL:
- 点击保存
使用其他 OpenAI 兼容服务(如 Groq)
- 修改 API 基础 URL(如
https://api.groq.com/openai/v1) - 输入对应服务的 API 密钥
- 设置对应的模型名称(如
whisper-large-v3)
3. 授予系统权限
在"系统权限"标签页中,确保以下权限已授予:
| 权限 | 用途 | 如何授权 |
|---|---|---|
| 麦克风 | 录制语音 | 点击"授权访问",在系统设置中勾选 iVoco |
| 无障碍 | 检测光标位置并粘贴文字 | 点击"授权访问",在系统设置中勾选 iVoco |
| 屏幕录制 | 获取上下文截图(提升转录准确度) | 点击"授权访问",在系统设置中勾选 iVoco |
授权步骤:
- 点击"授权访问"按钮
- 系统会自动打开"系统设置 > 隐私与安全性"
- 找到对应权限类别,勾选 iVoco
- 可能需要重启 iVoco 使权限生效
基本使用
语音转文字
- 按住快捷键(默认 Fn 键)开始录音
- 对着麦克风说话
- 松开快捷键,iVoco 会自动:
- 将语音发送到转录服务
- 进行后处理优化(如启用)
- 将文字粘贴到当前光标位置
快捷键选项:
- Fn(地球)键(默认)
- 右 Option 键
- F5 键
- 自定义按键(支持普通键或修饰键)
提示:如果使用 Fn 键时弹出表情符号选择器,请前往"系统设置 > 键盘",将"按下 Fn 键时"更改为"不执行任何操作"。
菜单栏功能
点击菜单栏 iVoco 图标可查看:
| 功能 | 说明 |
|---|---|
| 设置... | 打开设置窗口 |
| 运行日志... | 查看最近的转录记录 |
| 检查更新... | 手动检查软件更新 |
| 复制再次 | 重新复制上一次的转录结果 |
| 调试浮层 | 显示/隐藏录音状态浮层 |
| 退出 iVoco | 退出应用 |
高级设置
自定义词汇
在"定义词汇"标签页中,可以添加专业术语、人名、品牌名等,帮助转录更准确地识别特定词汇。
使用方法:
- 在文本框中输入词汇
- 使用逗号、换行或分号分隔多个词汇
- 词汇会自动应用于后处理阶段
示例:
OpenAI, ChatGPT, Ollama, macOS, SwiftUI
替换规则
设置自动替换规则,将转录中常见的错误识别结果自动纠正。
使用方法:
- 点击"新增规则"
- 左侧填写原词(如"阿里马")
- 右侧填写替换词(如"Ollama")
- 转录完成后会自动执行替换
后处理配置
后处理使用 LLM 对转录结果进行优化,包括:
- 去除填充词(嗯、啊、那个)
- 修正语法和标点
- 根据上下文优化格式
后处理提供方选项:
-
OpenAI 兼容 API
- 使用与转录相同的 API 配置
- 默认模型:gpt-4o-mini
- 可在设置中修改模型名称
-
Ollama(本地)
- 使用本地运行的 Ollama 服务
- 默认地址:
http://localhost:11434 - 点击"刷新模型"获取可用模型列表
- 点击"测试 Ollama"验证连接
-
禁用
- 跳过 LLM 后处理,直接输出原始转录结果
自定义后处理提示词:
- 支持编辑后处理使用的系统提示词
- 支持
{{PERSONAL_DICTIONARY}}占位符,会自动替换为个人词典 - 点击"恢复默认"可重置为默认提示词
界面语言
iVoco 支持 8 种语言界面:
- 简体中文
- 繁体中文
- English
- 日本語
- 한국어
- Deutsch
- Français
- Español
切换语言:
- 在"界面语言"标签页选择语言
- 重启 iVoco 使更改生效
启动设置
- 登录时启动 iVoco:开机自动启动应用
- 自动检查更新:启动时自动检查新版本
运行日志
运行日志记录最近 20 次转录的详细信息,包括:
- 原始转录文本
- 后处理后的文本
- 使用的自定义词汇
- 完整的处理流程
- 系统提示词(可展开查看)
用途:
- 检查转录质量
- 调试问题
- 优化自定义词汇和替换规则
操作:
- 点击单条记录可查看详情
- 点击删除图标可移除单条记录
- 点击"清除历史"可清空所有记录
故障排除
无法开始录音
检查麦克风权限:
- 打开"系统设置 > 隐私与安全性 > 麦克风"
- 确保 iVoco 已勾选
检查麦克风选择:
- 在"输入设备"标签页确认已选择正确的麦克风
- 尝试切换为"系统默认"
无法粘贴文字
检查无障碍权限:
- 打开"系统设置 > 隐私与安全性 > 无障碍"
- 确保 iVoco 已勾选
- 如已勾选但仍无法使用,尝试取消勾选后重新勾选
转录失败
检查 API 配置:
- 确认 API 密钥正确且有效
- 确认 API 基础 URL 可访问
- 确认模型名称正确
- 检查网络连接
查看运行日志:
- 打开"运行日志"查看详细的错误信息
快捷键无响应
Fn 键问题:
- 如果 Fn 键打开表情符号选择器,前往"系统设置 > 键盘",将"按下 Fn 键时"改为"不执行任何操作"
尝试其他快捷键:
- 在"键盘设置"中切换为"右 Option 键"或"F5 键"测试
后处理失败
检查 Ollama 配置(如使用):
- 确认 Ollama 服务已启动
- 确认基础 URL 正确(默认
http://localhost:11434) - 点击"测试 Ollama"验证连接
- 确认已选择有效的模型
隐私说明
- iVoco 没有后端服务器,所有数据仅在本地和配置的 API 服务之间传输
- 语音数据仅发送到转录 API(OpenAI 或兼容服务)
- 屏幕截图仅用于上下文分析,不会存储或上传
- 运行日志仅存储在本地,最多保留 20 条记录
快捷键汇总
| 操作 | 快捷键 |
|---|---|
| 开始/停止录音 | 按住 Fn(或自定义快捷键) |
| 打开设置 | 点击菜单栏图标 → 设置... |
| 查看运行日志 | 点击菜单栏图标 → 运行日志... |
| 退出应用 | 点击菜单栏图标 → 退出 iVoco |
iVoco - 让语音输入变得简单高效
分享: