Codebase-Memory-MCP 是一款高性能代码智能引擎,为 AI 编码助手提供代码库知识图谱。Tree-sitter AST 解析 158 种语言,Hybrid LSP 语义分析,99.2% Token 节省,让 AI 在毫秒级完成代码库探索,文末附详细使用教程

🎤 引言

Claude Code 用起来确实香,但有个痛点一直困扰着我——每次问它"这个函数被谁调用了"或者"帮我理清这个模块的依赖",它就开始满屏幕 grep,一个文件一个文件地翻。

这操作既费 Token 又慢,答案还容易遗漏。更要命的是,一旦开启新对话,这些好不容易建立起来的上下文理解就全丢了。

直到我发现了 Codebase-Memory-MCP,这玩意儿直接给 AI 装了个"代码记忆"——把整个代码库解析成知识图谱,AI 问啥直接查图,毫秒级响应。


⭐ 核心功能

🔥 毫秒级全代码库索引

官方的 benchmark 属实有点炸裂:

  • Linux 内核(2800 万行代码、7.5 万个文件)全量索引仅需 3 分钟
  • Django 框架(4.9 万节点)索引约 6 秒
  • 单次查询响应 <1 毫秒

这速度靠的是纯内存流水线 + LZ4 HC 压缩,索引完内存直接释放,不占地方。

🌳 Tree-sitter AST 解析 + Hybrid LSP 语义增强

支持 158 种编程语言 的 AST 解析,对主流语言还有额外的语义分析加持:

  • Python / TypeScript / JavaScript / JSX / TSX
  • PHP / C# / Go / C / C++ / Java / Kotlin / Rust

通过 Hybrid LSP 实现语义类型解析,比纯语法解析质量高一个档次。

🕸️ 知识图谱构建

解析结果存进 SQLite 图数据库,节点包括:

  • 函数、方法、类
  • 调用链
  • HTTP 路由
  • 跨服务链接

支持 Cypher-like 查询语言,想怎么探索就怎么探索。

🔍 死代码检测

内置死代码检测工具,基于入度过滤 + 入口点识别,实测全图扫描只要 150ms

🏗️ 架构可视化

集成 Louvain 社区检测算法,能自动发现代码库中的热点区域和模块边界。还有配套的 graph-ui 可以图形化查看知识图谱。

📊 14 个 MCP 工具

开箱即用地支持 Claude Code、Windsurf、Cursor、Codex CLI 等主流 AI 编码工具,一条命令 install 自动配置。


📥 安装使用

安装(一条命令搞定)

# macOS / Linux
curl -fsSL https://raw.githubusercontent.com/DeusData/codebase-memory-mcp/main/install.sh | sh

# Windows
winget install DeusData.codebase-memory-mcp

# 或者直接下载二进制
# https://github.com/DeusData/codebase-memory-mcp/releases

自动配置 AI 编码助手

codebase-memory-mcp install

这条命令会自动检测你安装的编码助手(Claude Code、Windsurf、Cursor 等),然后写入 MCP server 配置和 instruction 文件。

索引项目

在 Claude Code 里直接说:

» 索引这个项目

然后坐等几分钟(取决于代码库大小),图谱就建好了。之后问任何结构性问题:

» 找出所有未使用的函数
» ProcessOrder 函数被哪些地方调用了?
» 帮我追踪这个 API 的完整调用链
» 这个模块依赖哪些外部服务?

常用 MCP 工具

工具用途
codebase_search名称/正则搜索
codebase_graph图谱查询
codebase_xref交叉引用
codebase_dead_code死代码检测
codebase_call_trace调用链追踪
codebase_http_linksHTTP 链接分析
codebase_hotspots热点分析

🎯 适用场景

大型单体仓库维护

Linux 内核这种级别(2800 万行)的代码库,传统 grep 方式基本没法用。Codebase-Memory-MCP 3 分钟建好图谱,之后随便问。

需要深度理解陌生代码库

接手祖传代码、阅读开源项目结构时,图谱能帮你快速建立全局视角,而不是一头扎进文件堆里迷路。

AI 编码效率优化

每次对话都能复用同一个图谱,不用重复索引,Token 消耗直接降一个数量级。

代码审查与重构

死代码检测、调用链分析、跨模块依赖分析,这些结构化查询在重构前特别有用。


🔍 对比同类工具

工具核心思路索引速度Token 效率语言支持
Codebase-Memory-MCP知识图谱 + MCP3min/28MLOC99.2% 节省158 种
everything-claude-code全局索引较慢一般中等
传统 grep 探索N/A基准全部

根据 Reddit 用户反馈,5 个结构化问题:

  • 传统方式:约 412,000 tokens
  • Codebase-Memory-MCP:约 3,400 tokens
  • 节省约 120 倍

⚠️ 注意事项

  1. 首次索引耗时:大型代码库(如 Linux 内核)首次索引需要几分钟时间,后续增量同步会快很多
  2. 增量同步:编辑器保存文件时会自动同步图谱,无需手动触发
  3. 内存占用:索引期间内存占用较高(但会释放),大项目建议预留 8GB+ 内存
  4. 仅支持结构查询:图谱存储的是代码结构信息,不包含运行时数据流

✅ 总结

Codebase-Memory-MCP 解决的是 AI 编码助手最实际的痛点——代码探索效率。毫秒级查询、99.2% Token 节省、单二进制零依赖,这些特性让它在同类工具里相当能打。

唯一的小遗憾是目前图谱只存储代码结构,不支持运行时数据流分析。不过对于日常开发来说,结构化查询已经覆盖了 90% 的场景。

推荐指数:⭐⭐⭐⭐⭐

适合经常和大型代码库打交道、或者想让 AI 编程效率更上一层楼的开发者。

GitHubDeusData/codebase-memory-mcp