VoxType 是一款桌面端 AI 语音输入工具。按住快捷键说话,AI 自动识别并润色,输出干净可用的文字。
按住快捷键,说你想说的。松手,润色后的文字直接出现在光标处。
从语音到文字,从草稿到成品,每一步都为你优化
支持 Deepgram、AssemblyAI、Whisper、Groq、GLM-ASR、SiliconFlow 等 6+ STT 服务商,自由选择最优方案。
自动去除口水词、填充词,修正语法,整理重复内容,输出干净可用的文字草稿。Pro 版使用专属润色模型,效果更优。支持 OpenAI、DeepSeek、Claude、Gemini、Ollama 等多种 LLM。
按住快捷键即可说话,松手自动输出。在任何应用中无缝使用——文档、聊天、浏览器,无需切换窗口。
自带 API Key(Bring Your Own Key),语音数据不经过第三方中转。你掌控自己的密钥和数据,绝不上传到任何服务器。
支持语音输入直接翻译为目标语言,跨语言沟通无障碍。
自动保存识别记录,随时回顾。自定义词典确保专业术语和专有名词准确识别。Pro 版支持多设备同步,数据无缝流转。
无需配置,装上就能用
按住全局快捷键(默认 Ctrl+/),对着麦克风说出你想输入的内容
松开快捷键,语音立即被识别为文字,准确快速
AI 自动去除口水词、整理语序,将干净的文字直接输入到光标处
VoxType 采用 BYOK 模式,下面演示如何配置智谱 AI 实现中文语音输入与润色
访问 open.bigmodel.cn,注册并登录账号
进入「API 密钥」页面,点击「创建新密钥」,复制生成的 Key
打开 VoxType 设置 → 语音识别(STT)→ 选择「智谱 AI GLM-ASR」→ 粘贴 API Key → 语言选择「中文」
智谱 AI 的 STT 和 LLM 使用同一个 API Key,无需重复获取
打开 VoxType 设置 → 文本润色(LLM)→ 提供商选择「智谱 AI」→ 模型选择「GLM-4-Flash」→ 粘贴同一个 API Key
开启「润色」开关。现在按住快捷键说话,AI 会自动清理口水词并输出整洁的文字
和常见的语音输入方案对比
| 功能 | VoxType | macOS 听写 | Windows 语音 | Whisper Desktop |
|---|---|---|---|---|
| 免费使用 | ✓ | ✓ | ✓ | ✓ |
| AI 润色 | ✓ | ✗ | ✗ | ✗ |
| 多 STT 服务商 | ✓ 6+ | ✗ | ✗ | ✗ 仅 Whisper |
| 多 LLM 支持 | ✓ 5+ | ✗ | ✗ | ✗ |
| 隐私 / 离线可用 | ✓ BYOK | ✓ | ✗ | ✓ |
| 翻译模式 | ✓ | ✗ | ✗ | ✗ |
| 自定义词典 | ✓ | ✗ | ✗ | ✗ |
| 跨平台 | ✓ Win/Mac | ✗ 仅 Mac | ✗ 仅 Win | ✓ Win/Mac |
免费版已满足日常语音输入需求,Pro 版解锁更强润色能力
支持微信 · 支付宝 · 到期自动降级为 Free 版 · 手动续费不自动扣款
设置简单,上手零门槛
关于 VoxType 的常见疑问,也许能帮到你
免费下载,永久免费
支持 macOS 和 Windows · 安装包仅 15MB · 极速下载