字节笔记本

2026年2月26日

iVoco 产品使用说明

iVoco 是一款 macOS 菜单栏语音转文字应用,支持使用 OpenAI 兼容 API(如 OpenAI、Groq 等)或本地 Qwen 模型进行语音转录。只需按住快捷键说话,松开即可自动将语音转换为文字并粘贴到当前光标位置。

系统要求

  • macOS 13.0 或更高版本
  • 需要麦克风权限、无障碍权限和屏幕录制权限

首次使用

1. 安装与启动

  1. 下载 iVoco.dmg 并拖拽到应用程序文件夹
  2. 首次启动时,系统会提示授予必要权限
  3. iVoco 启动后会在菜单栏显示图标(🎤)

2. 配置 API 密钥

使用 OpenAI API(推荐)

  1. 点击菜单栏 iVoco 图标 → "设置..."
  2. 在"转录配置"标签页中:
    • API 基础 URL: https://api.openai.com/v1
    • 输入你的 OpenAI API 密钥
    • 转录模型: whisper-1
  3. 点击保存

使用其他 OpenAI 兼容服务(如 Groq)

  1. 修改 API 基础 URL(如 https://api.groq.com/openai/v1
  2. 输入对应服务的 API 密钥
  3. 设置对应的模型名称(如 whisper-large-v3

3. 授予系统权限

在"系统权限"标签页中,确保以下权限已授予:

权限用途如何授权
麦克风录制语音点击"授权访问",在系统设置中勾选 iVoco
无障碍检测光标位置并粘贴文字点击"授权访问",在系统设置中勾选 iVoco
屏幕录制获取上下文截图(提升转录准确度)点击"授权访问",在系统设置中勾选 iVoco

授权步骤

  1. 点击"授权访问"按钮
  2. 系统会自动打开"系统设置 > 隐私与安全性"
  3. 找到对应权限类别,勾选 iVoco
  4. 可能需要重启 iVoco 使权限生效

基本使用

语音转文字

  1. 按住快捷键(默认 Fn 键)开始录音
  2. 对着麦克风说话
  3. 松开快捷键,iVoco 会自动:
    • 将语音发送到转录服务
    • 进行后处理优化(如启用)
    • 将文字粘贴到当前光标位置

快捷键选项

  • Fn(地球)键(默认)
  • 右 Option 键
  • F5 键
  • 自定义按键(支持普通键或修饰键)

提示:如果使用 Fn 键时弹出表情符号选择器,请前往"系统设置 > 键盘",将"按下 Fn 键时"更改为"不执行任何操作"。

菜单栏功能

点击菜单栏 iVoco 图标可查看:

功能说明
设置...打开设置窗口
运行日志...查看最近的转录记录
检查更新...手动检查软件更新
复制再次重新复制上一次的转录结果
调试浮层显示/隐藏录音状态浮层
退出 iVoco退出应用

高级设置

自定义词汇

在"定义词汇"标签页中,可以添加专业术语、人名、品牌名等,帮助转录更准确地识别特定词汇。

使用方法

  1. 在文本框中输入词汇
  2. 使用逗号、换行或分号分隔多个词汇
  3. 词汇会自动应用于后处理阶段

示例

OpenAI, ChatGPT, Ollama, macOS, SwiftUI

替换规则

设置自动替换规则,将转录中常见的错误识别结果自动纠正。

使用方法

  1. 点击"新增规则"
  2. 左侧填写原词(如"阿里马")
  3. 右侧填写替换词(如"Ollama")
  4. 转录完成后会自动执行替换

后处理配置

后处理使用 LLM 对转录结果进行优化,包括:

  • 去除填充词(嗯、啊、那个)
  • 修正语法和标点
  • 根据上下文优化格式

后处理提供方选项

  1. OpenAI 兼容 API

    • 使用与转录相同的 API 配置
    • 默认模型:gpt-4o-mini
    • 可在设置中修改模型名称
  2. Ollama(本地)

    • 使用本地运行的 Ollama 服务
    • 默认地址:http://localhost:11434
    • 点击"刷新模型"获取可用模型列表
    • 点击"测试 Ollama"验证连接
  3. 禁用

    • 跳过 LLM 后处理,直接输出原始转录结果

自定义后处理提示词

  • 支持编辑后处理使用的系统提示词
  • 支持 {{PERSONAL_DICTIONARY}} 占位符,会自动替换为个人词典
  • 点击"恢复默认"可重置为默认提示词

界面语言

iVoco 支持 8 种语言界面:

  • 简体中文
  • 繁体中文
  • English
  • 日本語
  • 한국어
  • Deutsch
  • Français
  • Español

切换语言

  1. 在"界面语言"标签页选择语言
  2. 重启 iVoco 使更改生效

启动设置

  • 登录时启动 iVoco:开机自动启动应用
  • 自动检查更新:启动时自动检查新版本

运行日志

运行日志记录最近 20 次转录的详细信息,包括:

  • 原始转录文本
  • 后处理后的文本
  • 使用的自定义词汇
  • 完整的处理流程
  • 系统提示词(可展开查看)

用途

  • 检查转录质量
  • 调试问题
  • 优化自定义词汇和替换规则

操作

  • 点击单条记录可查看详情
  • 点击删除图标可移除单条记录
  • 点击"清除历史"可清空所有记录

故障排除

无法开始录音

检查麦克风权限

  1. 打开"系统设置 > 隐私与安全性 > 麦克风"
  2. 确保 iVoco 已勾选

检查麦克风选择

  1. 在"输入设备"标签页确认已选择正确的麦克风
  2. 尝试切换为"系统默认"

无法粘贴文字

检查无障碍权限

  1. 打开"系统设置 > 隐私与安全性 > 无障碍"
  2. 确保 iVoco 已勾选
  3. 如已勾选但仍无法使用,尝试取消勾选后重新勾选

转录失败

检查 API 配置

  1. 确认 API 密钥正确且有效
  2. 确认 API 基础 URL 可访问
  3. 确认模型名称正确
  4. 检查网络连接

查看运行日志

  • 打开"运行日志"查看详细的错误信息

快捷键无响应

Fn 键问题

  • 如果 Fn 键打开表情符号选择器,前往"系统设置 > 键盘",将"按下 Fn 键时"改为"不执行任何操作"

尝试其他快捷键

  • 在"键盘设置"中切换为"右 Option 键"或"F5 键"测试

后处理失败

检查 Ollama 配置(如使用)

  1. 确认 Ollama 服务已启动
  2. 确认基础 URL 正确(默认 http://localhost:11434
  3. 点击"测试 Ollama"验证连接
  4. 确认已选择有效的模型

隐私说明

  • iVoco 没有后端服务器,所有数据仅在本地和配置的 API 服务之间传输
  • 语音数据仅发送到转录 API(OpenAI 或兼容服务)
  • 屏幕截图仅用于上下文分析,不会存储或上传
  • 运行日志仅存储在本地,最多保留 20 条记录

快捷键汇总

操作快捷键
开始/停止录音按住 Fn(或自定义快捷键)
打开设置点击菜单栏图标 → 设置...
查看运行日志点击菜单栏图标 → 运行日志...
退出应用点击菜单栏图标 → 退出 iVoco

iVoco - 让语音输入变得简单高效

分享: