Codebase-Memory-MCP 是一款高性能代码智能引擎,为 AI 编码助手提供代码库知识图谱。Tree-sitter AST 解析 158 种语言,Hybrid LSP 语义分析,99.2% Token 节省,让 AI 在毫秒级完成代码库探索,文末附详细使用教程
🎤 引言
Claude Code 用起来确实香,但有个痛点一直困扰着我——每次问它"这个函数被谁调用了"或者"帮我理清这个模块的依赖",它就开始满屏幕 grep,一个文件一个文件地翻。
这操作既费 Token 又慢,答案还容易遗漏。更要命的是,一旦开启新对话,这些好不容易建立起来的上下文理解就全丢了。
直到我发现了 Codebase-Memory-MCP,这玩意儿直接给 AI 装了个"代码记忆"——把整个代码库解析成知识图谱,AI 问啥直接查图,毫秒级响应。
⭐ 核心功能
🔥 毫秒级全代码库索引
官方的 benchmark 属实有点炸裂:
- Linux 内核(2800 万行代码、7.5 万个文件)全量索引仅需 3 分钟
- Django 框架(4.9 万节点)索引约 6 秒
- 单次查询响应 <1 毫秒
这速度靠的是纯内存流水线 + LZ4 HC 压缩,索引完内存直接释放,不占地方。
🌳 Tree-sitter AST 解析 + Hybrid LSP 语义增强
支持 158 种编程语言 的 AST 解析,对主流语言还有额外的语义分析加持:
- Python / TypeScript / JavaScript / JSX / TSX
- PHP / C# / Go / C / C++ / Java / Kotlin / Rust
通过 Hybrid LSP 实现语义类型解析,比纯语法解析质量高一个档次。
🕸️ 知识图谱构建
解析结果存进 SQLite 图数据库,节点包括:
- 函数、方法、类
- 调用链
- HTTP 路由
- 跨服务链接
支持 Cypher-like 查询语言,想怎么探索就怎么探索。
🔍 死代码检测
内置死代码检测工具,基于入度过滤 + 入口点识别,实测全图扫描只要 150ms。
🏗️ 架构可视化
集成 Louvain 社区检测算法,能自动发现代码库中的热点区域和模块边界。还有配套的 graph-ui 可以图形化查看知识图谱。
📊 14 个 MCP 工具
开箱即用地支持 Claude Code、Windsurf、Cursor、Codex CLI 等主流 AI 编码工具,一条命令 install 自动配置。
📥 安装使用
安装(一条命令搞定)
# macOS / Linux
curl -fsSL https://raw.githubusercontent.com/DeusData/codebase-memory-mcp/main/install.sh | sh
# Windows
winget install DeusData.codebase-memory-mcp
# 或者直接下载二进制
# https://github.com/DeusData/codebase-memory-mcp/releases自动配置 AI 编码助手
codebase-memory-mcp install这条命令会自动检测你安装的编码助手(Claude Code、Windsurf、Cursor 等),然后写入 MCP server 配置和 instruction 文件。
索引项目
在 Claude Code 里直接说:
» 索引这个项目然后坐等几分钟(取决于代码库大小),图谱就建好了。之后问任何结构性问题:
» 找出所有未使用的函数
» ProcessOrder 函数被哪些地方调用了?
» 帮我追踪这个 API 的完整调用链
» 这个模块依赖哪些外部服务?常用 MCP 工具
| 工具 | 用途 |
|---|---|
codebase_search | 名称/正则搜索 |
codebase_graph | 图谱查询 |
codebase_xref | 交叉引用 |
codebase_dead_code | 死代码检测 |
codebase_call_trace | 调用链追踪 |
codebase_http_links | HTTP 链接分析 |
codebase_hotspots | 热点分析 |
🎯 适用场景
大型单体仓库维护
Linux 内核这种级别(2800 万行)的代码库,传统 grep 方式基本没法用。Codebase-Memory-MCP 3 分钟建好图谱,之后随便问。
需要深度理解陌生代码库
接手祖传代码、阅读开源项目结构时,图谱能帮你快速建立全局视角,而不是一头扎进文件堆里迷路。
AI 编码效率优化
每次对话都能复用同一个图谱,不用重复索引,Token 消耗直接降一个数量级。
代码审查与重构
死代码检测、调用链分析、跨模块依赖分析,这些结构化查询在重构前特别有用。
🔍 对比同类工具
| 工具 | 核心思路 | 索引速度 | Token 效率 | 语言支持 |
|---|---|---|---|---|
| Codebase-Memory-MCP | 知识图谱 + MCP | 3min/28MLOC | 99.2% 节省 | 158 种 |
| everything-claude-code | 全局索引 | 较慢 | 一般 | 中等 |
| 传统 grep 探索 | 无 | N/A | 基准 | 全部 |
根据 Reddit 用户反馈,5 个结构化问题:
- 传统方式:约 412,000 tokens
- Codebase-Memory-MCP:约 3,400 tokens
- 节省约 120 倍
⚠️ 注意事项
- 首次索引耗时:大型代码库(如 Linux 内核)首次索引需要几分钟时间,后续增量同步会快很多
- 增量同步:编辑器保存文件时会自动同步图谱,无需手动触发
- 内存占用:索引期间内存占用较高(但会释放),大项目建议预留 8GB+ 内存
- 仅支持结构查询:图谱存储的是代码结构信息,不包含运行时数据流
✅ 总结
Codebase-Memory-MCP 解决的是 AI 编码助手最实际的痛点——代码探索效率。毫秒级查询、99.2% Token 节省、单二进制零依赖,这些特性让它在同类工具里相当能打。
唯一的小遗憾是目前图谱只存储代码结构,不支持运行时数据流分析。不过对于日常开发来说,结构化查询已经覆盖了 90% 的场景。
推荐指数:⭐⭐⭐⭐⭐
适合经常和大型代码库打交道、或者想让 AI 编程效率更上一层楼的开发者。
GitHub:DeusData/codebase-memory-mcp