上下文管理与压缩

上下文管理是独立域，不耦合在 Agent 内部。本文档介绍两层压缩机制、触发条件、压缩策略和手动触发方式。

两层压缩机制

Coding Code 采用两层压缩策略，在不同阈值下自动触发：

微压缩 (Micro Compact)

轻量级压缩，对旧工具输出进行截断：

配置项	值	说明
触发阈值	`promptEstimate > contextWindow * 0.25`	prompt 估算超过上下文窗口 25% 时触发
压缩对象	旧 turn（`< currentTurnId - 1`）中的长工具输出	只压缩可压缩工具的输出
最小字符数	120 字符	短于 120 字符的输出不会被截断
压缩方式	生成 `CompactEvent` 写入 JSONL	保留前后部分，中间省略

可压缩工具：read_file、execute_command、search_code、search_files、web_search、fetch_url、write_file、edit_file

LLM 压缩 (LLM Compaction)

深度压缩，调用 LLM 生成结构化摘要：

配置项	值	说明
触发阈值	`promptEstimate > modelMaxTokens * 0.9`	prompt 估算超过模型最大 token 90% 时触发
保留最近 turn	1	保留最近 1 个 turn 不压缩
压缩方式	调用 LLM 生成摘要	输出 `<summary>...</summary>` 块
增量压缩	是	找到已有 SummaryEvent，只压缩 `lastSummarizedTurnId` 之后的事件
失败追踪	连续 3 次失败后停止	24 小时 TTL 后重置

压缩输出格式

LLM 压缩的摘要包含 10 个固定小节：

<analysis>
自由推理区域，分析对话内容和关键信息
</analysis>

<summary>
### Primary Request
用户的核心请求

### Key Technical Concepts
涉及的关键技术概念

### Files and Code Sections
相关文件和代码段

### Errors and Fixes
遇到的错误和修复

### Problem Solving
问题解决过程

### Decision Rationale
决策理由

### All User Messages
所有用户消息摘要

### Pending Tasks
待处理任务

### Current Work
当前工作内容

### Optional Next Step
可选的下一步
</summary>

事件类型

压缩操作在 JSONL 会话文件中记录为以下事件类型：

// 微压缩事件
interface CompactEvent {
  type: 'compact';
  uuid: string;
  startTurnId: number;
  endTurnId: number;
  timestamp: string;
}

// LLM 压缩摘要事件
interface SummaryEvent {
  type: 'summary';
  uuid: string;
  replaces: string[];          // 被替换的事件 UUID 列表
  summaryText: string;         // 摘要文本
  lastSummarizedTurnId: number; // 最后压缩到的 turn ID
  timestamp: string;
}

配置

在 codingcode.yaml 中配置上下文压缩：

context:
  compactionModel: ""    # 压缩用模型，空字符串回退到主会话 LLM

硬编码常量

以下常量当前硬编码在 context/service.ts 中：

常量	值	说明
`MICRO_COMPACT_THRESHOLD`	`0.25`	微压缩触发比例
`MICRO_COMPACT_MIN_CHARS`	`120`	微压缩最小字符数
`COMPACTION_THRESHOLD`	`0.9`	LLM 压缩触发比例
`KEEP_RECENT_TURNS`	`1`	保留最近 turn 数
`REACTIVE_COMPACT_MAX_RETRIES`	`3`	最大重试次数

手动触发

通过 API 手动触发 LLM 压缩：

路由	方法	Body	说明
`/api/sessions/:id/compact`	POST	`{ cwd }`	手动触发上下文压缩

interface CompressResult {
  didCompress: boolean;    // 是否执行了压缩
  released: number;        // 释放的 token 数
  promptEstimate: number;  // 压缩后的 prompt 估算
}

手动触发会强制执行 LLM 压缩，不受阈值限制。

也可通过 AgentClient SDK 调用：

const client = await createHttpClient('http://localhost:8080');
await client.compact();

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

上下文管理与压缩

两层压缩机制

微压缩 (Micro Compact)

LLM 压缩 (LLM Compaction)

压缩输出格式

事件类型

配置

硬编码常量

手动触发

FilesExpand file tree

context.md

Latest commit

History

context.md

File metadata and controls

上下文管理与压缩

两层压缩机制

微压缩 (Micro Compact)

LLM 压缩 (LLM Compaction)

压缩输出格式

事件类型

配置

硬编码常量

手动触发