Claude Code 实现原理 - 上下文管理

根据代码分析，Claude Code 的**上下文管理**是一个复杂的多层架构系统，主要通过以下几个核心机制实现：<cite/>

## 核心上下文管理架构

### 三层存储架构

Claude Code 采用三层记忆存储架构进行上下文管理： [1](#5-0) 

- **短期记忆**：当前会话上下文 (`messages[]`)，实时访问
- **中期记忆**：压缩后历史对话 (`compactSummary`)，智能压缩
- **长期记忆**：CLAUDE.md 系统，文件系统存储

### Token 管理与计算

上下文管理的核心是精确的 Token 计算机制： [2](#5-1) 

`VE` 函数通过反向遍历消息数组，高效计算最新的 Token 使用情况，包括缓存 Token 的处理。

## 自动压缩机制

### 压缩触发条件

系统使用 92% 阈值自动触发上下文压缩： [3](#5-2) 

关键参数包括：
- **压缩阈值**：92% (h11 = 0.92)
- **警告级别**：60% (_W5 = 0.6), 80% (jW5 = 0.8)
- **最大输出Token**：16384 (CU2)

### 8段式压缩算法

压缩过程采用结构化的 8 段式压缩： [4](#5-3) 

通过 `AU2` 函数生成标准化的压缩提示，确保关键信息的保留。

## 上下文注入与构建

### 动态上下文注入

系统通过 `Ie1` 函数实现智能的上下文注入： [5](#5-4) 

包括 system-reminder 机制和文件内容的安全注入。

### 文件内容安全包装

文件内容注入时会自动添加安全提醒： [6](#5-5) 

通过 `tG5` 常量注入恶意代码检测提醒，确保安全性。

## 主循环中的上下文管理

### nO 主循环集成

在 Agent 主循环 (`nO` 函数) 中，上下文管理是核心环节： [7](#5-6) 

每次循环都会检查上下文长度，必要时触发压缩。

### 流式处理支持

上下文管理支持流式处理，通过 `wu` 会话流生成器实现： [8](#5-7) 

## 性能优化策略

### 缓存感知计算

Token 计算包含缓存感知机制： [9](#5-8) 

`zY5` 函数计算包括缓存创建和读取 Token 在内的总 Token 数。

### 渐进式警告系统

系统实现了多级警告机制，在不同阈值下提供不同级别的警告，帮助用户了解上下文使用情况。

## Notes

Claude Code 的上下文管理是一个高度优化的系统，通过三层存储、智能压缩、安全注入和流式处理等机制，在有限的上下文窗口中实现了长时间对话的连续性。特别值得注意的是，SubAgent 的上下文是完全隔离的，不参与主 Agent 的上下文管理，这种设计既保证了系统的可扩展性，又避免了上下文污染问题。

Wiki pages you might want to explore:
- [Overview (shareAI-lab/analysis_claude_code)](/wiki/shareAI-lab/analysis_claude_code#1)

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Claude Code 实现原理 - 上下文管理 #132

核心上下文管理架构

三层存储架构

Token 管理与计算

自动压缩机制

压缩触发条件

8段式压缩算法

上下文注入与构建

动态上下文注入

文件内容安全包装

主循环中的上下文管理

nO 主循环集成

流式处理支持

性能优化策略

缓存感知计算

渐进式警告系统

Notes

Metadata

Assignees

Labels

Projects

Milestone

Relationships

Development

Claude Code 实现原理 - 上下文管理 #132

Description

核心上下文管理架构

三层存储架构

Token 管理与计算

自动压缩机制

压缩触发条件

8段式压缩算法

上下文注入与构建

动态上下文注入

文件内容安全包装

主循环中的上下文管理

nO 主循环集成

流式处理支持

性能优化策略

缓存感知计算

渐进式警告系统

Notes

Metadata

Metadata

Assignees

Labels

Projects

Milestone

Relationships

Development

Issue actions