图解速览 — 一张图读懂 Alembic

25 张手绘风格架构图，5 分钟快速理解整个系统。

Alembic 是一个 AI 驱动的项目知识引擎——它从代码中提取知识、持续进化知识、在开发时交付知识。本文用图解方式，沿着系统的六大部分快速走一遍。

Part I · 起点与哲学

核心工作流

Alembic 本质上做两件事：一次构建有限答案，持续回答无限问题。

代码经过 AST 分析和 Agent 推理挖掘后，经由人工审核，沉淀为知识有机体（Knowledge Organism）。之后通过 MCP 协议被各种 IDE Agent 消费——Guard 检查合规、Search 检索知识、Agent 回答问题。

核心工作流

工程规模

从工程规模看，Alembic 是一个 12 万行 TypeScript 的完整系统，支持 10 种编程语言、61+ Agent 工具、9 维度知识覆盖。

工程规模

SOUL 原则

所有设计决策遵循 SOUL 宪章——3 条硬约束（安全、确定性、隐私）+ 5 条设计哲学（渐进式、信号驱动、有机进化、纵深防御、诚实边界），构成系统的身份约束。

SOUL 宪章

本地记忆主权

Alembic 的所有知识、记忆、行为信号都存储在项目本地——四层记忆架构（知识库 → 行为信号 → Agent 记忆 → 会话上下文）从临时到永久递进，信息密度逐层提升。PathGuard 文件沙箱 + stdio 零网络架构确保数据不外泄。

Part II · 工程基石

七层分层架构

代码组织在 lib/ 目录下，形成 7 个逻辑层：Entry Points → Bootstrap → Injection → Agent → Service → Core+Domain → Infrastructure。每层有严格的单向依赖规则：上层可以依赖下层，反之不行。

七层架构

六层安全链路

每个请求（MCP / HTTP / CLI）经过六层纵深防御：Constitution 角色权限 → Gateway 管线 → PermissionManager RBAC → SafetyPolicy 行为沙箱 → PathGuard 文件系统沙箱 → ConfidenceRouter 知识质量门控。任何一层失败即阻断请求。

六层安全链路

结构分析链

代码理解是五阶段管线：单文件 AST 解析（Tree-sitter WASM, 10 语言）→ 继承图构建 → 调用图推断（5 步增量管线）→ 设计模式检测（Singleton/Delegate/Factory/Observer）→ Tarjan SCC + Kahn 拓扑分层。最终输出 ProjectGraph 供 Panorama 消费。

结构分析链

Part III · 知识领域

KnowledgeEntry — 统一实体

所有知识（Recipe、Rule、Fact、Pattern）共享同一个 KnowledgeEntry 实体。V3 版本包含 25+ 字段，覆盖元数据、约束、语义、统计四个维度。

V3 字段全景

继承 vs 统一

早期版本曾用继承模型（RecipeEntry / RuleEntry / FactEntry 分别建表），V3 重构为统一实体+ kind 字段区分。这消除了 70% 的重复代码和跨类型查询的 UNION 操作。

继承 vs 统一

候选到 Recipe 的旅程

一条知识从候选（Candidate）到正式发布（Recipe）经过：AI 富化 → 25 维质量评分 → 置信度路由 → 宽限期观察 → 发布。

候选到 Recipe

六态生命周期

每条知识的生命周期是六态状态机：pending → active → evolved（或 deprecated → archived），以及特殊的 superseded 状态。状态转换由信号驱动，不可逆。

六态生命周期

进化提案流程

当系统检测到知识需要更新时（衰退、冲突、冗余），自动生成 EvolutionProposal，经过 StagingManager 的置信度分级宽限期后，触发实际状态转换。

进化提案流程

衰退评分模型

衰退检测基于 6 种策略加权计算 0-100 分数，映射到 5 个级别（healthy → critical）。包括无命中衰退、搜索稀疏、技术版本偏移等维度。

衰退评分模型

维度框架

质量评分采用三层结构：25 个原子维度 → 分组聚合 → 总分。每个维度有独立的评分函数和权重，确保不同类型的知识有针对性的质量标准。

维度框架

置信度路由

评分完成后，ConfidenceRouter 根据总分将知识分流到不同路径：高置信度自动发布、中置信度进入宽限期、低置信度等待人工审核。

置信度路由

Part IV · 核心服务

Bootstrap 双路径架构

冷启动采用 Phase 0-4 共享管线 + 双路径分叉：内部路径（FanOut 并行 AI 填充）和外部路径（Mission Briefing 交给 IDE Agent）。两条路径最终汇聚到同一个知识库。

Bootstrap 双路径

Guard 四层检测

合规检测是四层渐进深入：正则匹配（微秒级）→ 代码级跨行分析（毫秒级）→ AST 语义查询（十毫秒级）→ AST 深度度量+跨文件分析（百毫秒级）。输出三态结果：pass / violation / uncertain。

Guard 四层检测

Search 混合检索

搜索引擎融合双路召回：FieldWeighted 字段加权（trigger ×5、title ×3、tags ×2）+ HNSW 向量语义（本地 Ollama Embedding，毫秒级推理）。结果经过自适应 alpha RRF 融合 + 三级重排（CoarseRanker → MultiSignalRanker → ContextBoost）后返回。

Confidence Gate 查询路由

SearchEngine 的 auto 模式先跑关键词评估 Confidence（0–100），基于标题匹配、CamelCase 识别、分数断崖等正负向信号决定是否调用语义搜索。高置信度（≥60）直接返回关键词结果（40ms）；低置信度走 RRF 融合，alpha 自适应：α = 0.4 + 0.35 × (1 - conf/60)——confidence 越低，语义权重越高。

Confidence Gate

Panorama · Signal · 代谢

三个子系统构成知识的自我治理链路：Panorama（感知项目结构与覆盖率）→ Signal（捕获 12 种行为信号）→ Metabolism（驱动衰退检测、矛盾发现、冗余分析、进化提案）。

三系统数据链路

Part V · Agent 智能层

AgentRuntime — ReAct 循环

Agent 采用 ReAct（Reasoning + Acting）推理循环：思考 → 调用工具 → 观察结果 → 再思考。每轮最多 12 次工具调用，支持流式输出。

ReAct 循环架构

正交组合

Agent 的行为由三个正交维度决定：Capability（能做什么）× Strategy（怎么做）× Policy（边界约束）。三个维度独立变化、自由组合，避免了 Agent 类型的组合爆炸。

正交组合立方体

工具与记忆

61+ 工具分为知识管理、代码分析、搜索检索、系统管理四大类。记忆系统包含短期记忆（对话上下文）和长期记忆（项目事实），支持跨会话持久化。

工具与记忆全景

Part VI · 平台与交付

数据基础设施

四层数据架构：ServiceContainer（DI 容器，9 模块 70+ 服务）→ SQLite 关系存储（better-sqlite3 + WAL）→ Vector 向量存储（HNSW + SQ8 量化）→ Cache 缓存体系（LRU + GraphCache + CacheCoordinator）。底层是审计与监控（AuditLogger + Winston Logger + ConfigLoader）。

数据基础设施四层

MCP 六通道交付

通过 MCP（Model Context Protocol）将知识交付到 6 种 IDE Agent：Cursor、Windsurf、Copilot、Qodo、Cline、Trae。每种 IDE 有各自的配置格式，但消费的是同一个知识库。

MCP 交付全景

Task 意图生命周期

MCP 工具中最特殊的 asd_task 管理 Agent 自身的行为——五阶段闭环：Prime（IntentExtractor 意图识别 + PrimeSearchPipeline 多查询知识检索）→ Create（生成任务锚点）→ 行为自动采集（工具调用、搜索查询、文件引用、意图漂移检测）→ Close（IntentChain 持久化到 SignalBus → JSONL）→ Guard Review（git diff 增量审计 + inline Recipe 修复）。Close 返回 nextAction.required: true 强制 Agent 执行 Guard——协议层驱动，不依赖 Agent 自觉。

Task 意图生命周期链

四端接入

四种界面形态共享一个 ServiceContainer 内核：CLI（Commander.js 18+ 命令）、Dashboard（React 19 + Socket.IO 实时推送）、VSCode Extension（CodeLens + Guard 诊断）、飞书 Lark Transport（群聊→知识入口）。业务逻辑在 Service 层，界面层不含数据访问。

四端接入架构

一句话总结

Alembic = 代码理解（AST）+ 知识建模（KnowledgeEntry）+ 质量治理（Guard + Metabolism）+ 智能交付（Agent + MCP）
从源代码到项目知识，从知识到开发者手中——这就是 Alembic 的完整故事。

图解速览 — 一张图读懂 Alembic ​

Part I · 起点与哲学 ​

核心工作流 ​

工程规模 ​

SOUL 原则 ​

本地记忆主权 ​

Part II · 工程基石 ​

七层分层架构 ​

六层安全链路 ​

结构分析链 ​

Part III · 知识领域 ​

KnowledgeEntry — 统一实体 ​

继承 vs 统一 ​

候选到 Recipe 的旅程 ​

六态生命周期 ​

进化提案流程 ​

衰退评分模型 ​

维度框架 ​

置信度路由 ​

Part IV · 核心服务 ​

Bootstrap 双路径架构 ​

Guard 四层检测 ​

Search 混合检索 ​

Confidence Gate 查询路由 ​

Panorama · Signal · 代谢 ​

Part V · Agent 智能层 ​

AgentRuntime — ReAct 循环 ​

正交组合 ​

工具与记忆 ​

Part VI · 平台与交付 ​

数据基础设施 ​

MCP 六通道交付 ​

Task 意图生命周期 ​

四端接入 ​

一句话总结 ​

图解速览 — 一张图读懂 Alembic

Part I · 起点与哲学

核心工作流

工程规模

SOUL 原则

本地记忆主权

Part II · 工程基石

七层分层架构

六层安全链路

结构分析链

Part III · 知识领域

KnowledgeEntry — 统一实体

继承 vs 统一

候选到 Recipe 的旅程

六态生命周期

进化提案流程

衰退评分模型

维度框架

置信度路由

Part IV · 核心服务

Bootstrap 双路径架构

Guard 四层检测

Search 混合检索

Confidence Gate 查询路由

Panorama · Signal · 代谢

Part V · Agent 智能层

AgentRuntime — ReAct 循环

正交组合

工具与记忆

Part VI · 平台与交付

数据基础设施

MCP 六通道交付

Task 意图生命周期

四端接入

一句话总结