Amical 是开源本地优先 AI 听写应用,搭载 Whisper 与开源 LLM 实现离线高精度语音转文字。支持上下文感知(识别邮件/Discord/IDE 场景自动调格式)、Mac/Windows/iOS/Android 全平台、1.3k+ Stars MIT 开源。

🎤 引言

你每天在键盘上敲多少字?邮件、Slack、文档、代码注释……其实很多内容,嘴巴说比手敲快得多。

但市面上的语音输入法,要么是闭源的「黑盒」(Wispr Flow、Granola、SuperWhisper 月费 15-30 美元),要么就是把音频偷偷传上云的「假本地」(Mac 原生 Dictation)。如果你想要一个真正开源、本地优先、AI 加持的听写工具,Amical 是个值得关注的选择。

官方 slogan 就一句话:"Type 3x faster, no keyboard needed. Powered by open source models, works offline, fast and accurate."

GitHub 上 Star 数已达 1,379(2026-06-24 抓取),Fork 123,License MIT,最近一次提交就在 24 小时前,活跃度拉满。


⭐ 核心功能

🎯 上下文感知听写(Context-aware Dictation)

这是 Amical 区别于普通语音输入法的最大卖点——它会看你当前在用什么 App,自动调整输出格式

官方描述:

Context-aware dictation that adapts to what you're doing: drafting an email, chatting on Discord, writing prompts in your IDE, or messaging friends. Amical detects the active app and formats your speech accordingly.

举几个真实场景:

  • 写邮件时:自动加称呼、问候语、签名
  • Discord 聊天时:口语化、不带签名、保留 emoji 提示
  • IDE 里写 prompt:直接生成结构化代码块
  • 发短信给朋友:纯文字、不用敬语

🚀 极速本地转写

底层用 Whisper 模型做 STT,配合开源 LLM 做后处理。Whisper 模型在 Mac M1+ / Windows NPU 上推理基本无延迟,比手敲快 3 倍——官方实测数据,社区反馈 M2 Mac 上说话到出字几乎同步。

🔒 隐私优先 / 完全离线

Privacy-first: works offline, one click setup of local models in-app

所有数据走本地,不用担心老板/客户邮件草稿被传到云端。首次启动时一键下载 Whisper 模型到本地,之后完全离线可用。对处理敏感信息(医疗、法律、企业内部沟通)的用户特别友好。

🧠 智能语音笔记(进行中)

Smart voice notes → summaries, tasks, structured notes

不只能听写,还能把语音转成结构化笔记——自动生成 summary、提取 action items、按时间戳分段。状态:进行中(◑)。

🔌 MCP 集成(规划中)

MCP integration → voice commands that control your apps

未来会接入 Model Context Protocol,允许用语音控制其他 App(发邮件、调日历、查数据库等)。这个方向如果实现,Amical 就不只是「听写工具」,而是「语音 Agent」了。状态:规划中(◯)。

🎙️ 实时会议转录(规划中)

Real-time meeting transcription (mic + system audio)

自动识别「我在说话」还是「对方在说话」,多说话人标注,导出会议纪要。状态:规划中(◯)。

🔧 可扩展工作流

Extensible via hotkeys, voice macros, custom workflows

支持自定义热键、语音宏(说「换行」自动按 Enter)、自定义 prompt 模板。

📦 4 大平台覆盖

平台状态
macOS✅ 已发布(Homebrew 可装)
Windows✅ 已发布
Android (Google Play)✅ 已发布
iOS🟡 申请 Beta 中

📥 安装使用

macOS 用户(推荐)

方式一:Homebrew 一键安装

brew install --cask amical

方式二:直接下载

前往 amical.ai/download 下载 .dmg,拖入 Applications 文件夹即可。

Windows 用户

前往 amical.ai/download 下载 .exe 安装包,按向导完成即可。

Android 用户

直接在 Google Play 搜索 Amical 安装。配合系统输入法使用即可。

iOS 用户

当前仅供 Beta 测试,需在 官网 提交申请。

首次配置

  1. 启动后授予麦克风权限
  2. 选择 Whisper 模型(推荐 large-v3-turbo,中文识别精度最高)
  3. 设置全局热键(默认 Option + Space,跟 macOS Spotlight 类似)
  4. 在「Context Profiles」里绑定常用 App(Mail、Discord、VS Code、WeChat)

完成后,在任何输入框按住热键说话,松开即出文字。


🔍 对比/替代方案

Amical vs Wispr Flow

  • Wispr Flow:闭源 SaaS,月费 ~$15,Mac/iOS,云端依赖
  • Amical:开源 MIT,本地优先,跨平台,免费

Amical 在中文识别准确率上比 Wispr Flow 更稳(Whisper 大模型对中文优化更激进),且不会有「断网就罢工」的问题。

Amical vs SuperWhisper

官方自己也写了 对比页

SuperWhisper is a polished paid dictation app for the Mac. Amical matches it on accuracy and on the local-first posture, ships the same workflow to Windows.

简单说:SuperWhisper 贵且 Mac 独占,Amical 免费且跨平台,体验相当。

Amical vs Whispering

  • Whisperingepicenter-so/whispering):开源轻量,但 UI 较简陋,无上下文感知
  • Amical:UI 现代化、上下文感知是核心卖点

如果只是简单录音转写,Whispering 够用;如果要「说出来直接发邮件/写代码」,Amical 更顺手。

Amical vs Mac 原生 Dictation

  • 原生 Dictation:基础离线,离线后功能大幅缩水,无上下文感知
  • Amical:完整功能离线可用,上下文感知 + LLM 后处理明显更智能

⚠️ 注意事项

关于准确率的坑

  • 小模型可能不够用tinybase 模型识别长句、专业术语会出错,建议至少 small,中文推荐 large-v3
  • 口音与方言:Whisper 对普通话识别很好,但方言、严重口音需要 large-v3-turbo 才能稳
  • 专业领域术语:医生/律师/程序员建议在「Custom Vocabulary」里加白名单

关于性能的坑

  • 首次启动慢:首次下载 Whisper large 模型(约 1.5GB)需要几分钟
  • 老款 Intel Mac 体验差:M1 之前的 Mac 跑 large 模型会卡顿明显,建议选 small/medium 模型
  • 电池消耗:长时间听写会显著增加功耗,建议插电使用

关于生态的坑

  • iOS 仅 Beta:生产环境别指望 iOS 版
  • MCP / 会议转录未上线:核心规划功能还在 roadmap,别基于「未来功能」做决策
  • 企业级管理缺失:无 SSO、无团队管理后台,中小企业部署要自己包一层

已知问题(来自 GitHub Issues,共 46 个)

  • 某些 Electron 版本下 macOS 菜单栏图标会闪烁Issue #42 在跟进
  • 中文长段落偶尔出现重复字:社区反馈是 LLM 后处理过于「贴心」,可关闭后处理纯用 Whisper
  • Windows 上 NVIDIA GPU 调用率低:默认走 CPU 推理,开发者说在重构 inference 引擎

✅ 总结

Amical 适合谁用?

  • 🗣️ 每天大量文字工作的人:写邮件、写文档、写代码注释
  • 🔒 注重隐私的人:医疗、法律、企业内部沟通,绝不上云
  • 🌍 中英文混输用户:Whisper 大模型对中英混杂支持极好
  • 💻 多平台用户:Mac + Windows + Android + iOS(Beta)通吃
  • 🤖 想试 MCP 的极客:MCP 集成虽然还在规划,但仓库已 ready

不适合谁?

  • ❌ 想要「开箱即用 0 配置」的人(Whisper 模型选择、Context Profile 配置需要动手)
  • ❌ 2018 年前的 Intel Mac 用户(性能跟不上)
  • ❌ 重度依赖 iOS 生产力的人(iOS 还在 Beta)

一句话推荐:如果你受够了闭源听写工具的月费和「云端黑盒」,又不想用那种简陋到只能转写不能干别的开源工具,Amical 是个不错的中间方案。1.3k+ Stars、MIT 协议、活跃更新(最近 24h 还在 push),可以放心上车。

更多详情: