检查点（Checkpointing）

一、为什么需要检查点#

你的系统用了预写日志（WAL）来保证持久性——每次操作先写日志再执行，崩溃后重放日志恢复状态。这很可靠，直到数据库跑了一年：WAL 文件累积了几十个 GB。服务器重启后，重放全部日志需要 20 分钟，期间服务不可用。

更糟的是，WAL 会无限增长。没有机制告诉系统「这些日志已经没用了」，旧日志只能一直留着。磁盘空间和恢复时间都在持续膨胀。

检查点要解决的就是这个问题：定期对当前状态做一次快照，快照完成之前的日志就可以安全删除。崩溃恢复时，加载最近的检查点，只重放之后的日志。检查点越频繁，恢复越快——但每次检查点都有 I/O 开销。这是一个经典的权衡。

二、现实类比#

游戏存档。玩一会儿，按「保存」，如果死了就从最近的存档点重来，而不是从头开始。存档越频繁，丢失的进度越少——但每次存档都需要时间。没有存档的话，每次死亡都要从第一关重新打，和没有检查点时重放全部日志一个道理。

三、核心思想#

检查点在已知时间点捕获当前系统状态的一致性快照。崩溃后，恢复加载最后的检查点，只重放之后记录的操作。没有检查点，基于 WAL 的系统必须在每次重启时重放整个历史——恢复时间会无限增长。检查点将恢复时间限制在最后一个检查点以来的时间间隔内。

flowchart LR subgraph WAL OP1[op1] --> OP2[op2] --> OP3[op3] --> OP4[op4] --> OP5[op5] --> OP6[op6] --> OP7[op7] --> OP8[op8] end CP1["检查点 1"] -.-> OP3 CP2["检查点 2"] -.-> OP6 style CP1 fill:#f9f,stroke:#333 style CP2 fill:#f9f,stroke:#333

没有检查点：恢复需重放 op1-op8（8 次操作）。有检查点：恢复只需加载检查点 2，重放 op7-op8（2 次操作）。检查点之前的日志可以安全截断。

属性	值
恢复时间	与上次检查点以来的操作数成正比
检查点代价	O(state_size) 序列化当前状态
WAL 截断	可安全丢弃检查点之前的日志条目
一致性	检查点必须捕获一致性快照

四、变体与对比#

模式	关系	区别
预写日志（WAL）	检查点截断 WAL	WAL 保证持久性，检查点限制恢复时间
写时复制（Copy-on-Write）	COW 在不停止写入的情况下实现一致快照	COW 是快照技术，检查点是恢复策略
逻辑时钟（Logical Clock）	检查点与逻辑时钟位置关联	逻辑时钟保证一致性顺序，检查点提供恢复起点
Merkle 树	Merkle 树验证检查点完整性	Merkle 树是校验工具，检查点是恢复机制

检查点与 WAL 是互补关系：WAL 解决「数据不丢」的问题，检查点解决「恢复不慢」的问题。没有 WAL，检查点之后的操作会丢失；没有检查点，WAL 会无限增长导致恢复时间失控。

五、多语言实现#

5.1 Go 实现#

1
package checkpoint
2

3
// LogEntry WAL 日志条目
4
type LogEntry struct {
5
    ID        int
6
    Operation string
7
    Key       string
8
    Value     any
9
}
10

11
// stateSnapshot 检查点快照
12
type stateSnapshot struct {
13
    state       map[string]any
14
    walPosition int // 快照对应的 WAL 位置
15
}
16

17
// CheckpointableStore 带检查点的可恢复存储
18
type CheckpointableStore struct {
19
    state      map[string]any
20
    wal        []LogEntry
21
    nextID     int
22
    checkpoint *stateSnapshot
23
}
24

25
func NewStore() *CheckpointableStore {
26
    return &CheckpointableStore{
27
        state:  make(map[string]any),
28
        nextID: 1,
29
    }
30
}
31

32
// Apply 执行操作并记录到 WAL
33
func (s *CheckpointableStore) Apply(operation, key string, value any) {
34
    entry := LogEntry{ID: s.nextID, Operation: operation, Key: key, Value: value}
35
    s.nextID++
36
    s.wal = append(s.wal, entry)
37
    s.executeOp(entry)
38
}
39

40
// Get 读取当前状态
41
func (s *CheckpointableStore) Get(key string) (any, bool) {
42
    v, ok := s.state[key]
43
    return v, ok
44
}
45

46
// TakeCheckpoint 创建检查点：快照当前状态和 WAL 位置
47
func (s *CheckpointableStore) TakeCheckpoint() {
48
    snap := make(map[string]any, len(s.state))
49
    for k, v := range s.state {
50
        snap[k] = v
51
    }
52
    s.checkpoint = &stateSnapshot{state: snap, walPosition: len(s.wal)}
53
}
54

55
// SimulateCrash 模拟崩溃：清空内存状态
56
func (s *CheckpointableStore) SimulateCrash() {
57
    s.state = make(map[string]any)
58
}
59

60
// Recover 从检查点 + WAL 恢复，返回重放的条目数
61
func (s *CheckpointableStore) Recover() int {
62
    if s.checkpoint != nil {
63
        s.state = make(map[string]any, len(s.checkpoint.state))
64
        for k, v := range s.checkpoint.state {
65
            s.state[k] = v
66
        }
67
        replayed := 0
68
        for i := s.checkpoint.walPosition; i < len(s.wal); i++ {
69
            s.executeOp(s.wal[i])
70
            replayed++
71
        }
72
        return replayed
73
    }
74
    // 无检查点：重放整个 WAL
75
    s.state = make(map[string]any)
76
    for _, entry := range s.wal {
77
        s.executeOp(entry)
78
    }
79
    return len(s.wal)
80
}
81

82
func (s *CheckpointableStore) executeOp(entry LogEntry) {
83
    switch entry.Operation {
84
    case "SET":
85
        s.state[entry.Key] = entry.Value
86
    case "DELETE":
87
        delete(s.state, entry.Key)
88
    }
89
}

5.2 TypeScript 实现#

1
// WAL 日志条目
2
interface LogEntry {
3
  id: number;
4
  operation: string;
5
  data: { key: string; value: unknown };
6
}
7

8
// 带检查点的可恢复存储
9
class CheckpointableStore {
10
  private state = new Map<string, unknown>();
11
  private wal: LogEntry[] = [];
12
  private nextId = 1;
13
  private checkpoint: { state: Map<string, unknown>; walPosition: number } | null = null;
14

15
  // 执行操作并记录到 WAL
16
  apply(operation: string, key: string, value: unknown): void {
17
    const entry: LogEntry = { id: this.nextId++, operation, data: { key, value } };
18
    this.wal.push(entry);
19
    this.executeOp(entry);
20
  }
21

22
  get(key: string): unknown {
23
    return this.state.get(key);
24
  }
25

26
  // 创建检查点
27
  takeCheckpoint(): void {
28
    this.checkpoint = {
29
      state: new Map(this.state), // 浅拷贝当前状态
30
      walPosition: this.wal.length,
31
    };
32
  }
33

34
  // 模拟崩溃
35
  simulateCrash(): void {
36
    this.state = new Map();
37
  }
38

39
  // 从检查点 + WAL 恢复
40
  recover(): number {
41
    if (this.checkpoint) {
42
      this.state = new Map(this.checkpoint.state);
43
      let replayed = 0;
44
      for (let i = this.checkpoint.walPosition; i < this.wal.length; i++) {
45
        this.executeOp(this.wal[i]!);
46
        replayed++;
47
      }
48
      return replayed;
49
    }
50
    // 无检查点：重放整个 WAL
51
    this.state = new Map();
52
    for (const entry of this.wal) this.executeOp(entry);
53
    return this.wal.length;
54
  }
55

56
  private executeOp(entry: LogEntry): void {
57
    const { key, value } = entry.data;
58
    if (entry.operation === "SET") this.state.set(key, value);
59
    else if (entry.operation === "DELETE") this.state.delete(key);
60
  }
61
}

一个重要的安全原则：只有在检查点完全写入并确认持久化（fsync）之后，才能截断检查点之前的 WAL。如果检查点写入中途崩溃，你又提前删了 WAL，就既丢了不完整的检查点，又丢了恢复所需的日志。安全顺序是：写临时文件 → fsync → 原子重命名 → 才截断 WAL。

六、生产验证#

PostgreSQL — checkpointer.c#L218-L360 中 CheckpointerMain 是检查点后台进程。循环等待检查点请求或 checkpoint_timeout（默认 5 分钟），调用 CreateCheckPoint 将所有脏缓冲区刷写到磁盘，写入检查点 WAL 记录，更新 pg_control。崩溃恢复时从最后的检查点开始重放 WAL。
Redis — rdb.c#L1414-L1529 中 rdbSaveRio 将整个 Redis 数据集序列化到 RDB 文件。Redis fork 一个子进程写入快照而不阻塞主线程。RDB 文件就是完整的检查点，结合 AOF 只需重放最后一次 RDB 之后的 AOF 条目。
Apache Flink — 基于 Chandy-Lamport 算法的分布式快照实现精确一次的流处理保证。

七、小结#

何时使用：

数据库崩溃恢复——限制 WAL 重放时间（PostgreSQL、MySQL）
内存缓存持久化——重启后恢复状态（Redis RDB）
流处理——保存处理位置实现精确一次保证（Flink、Kafka）
长时间运行的计算——保存进度在故障后恢复（ML 训练）

何时不用：

无状态服务——没有需要检查点的状态
非常小的状态——WAL 重放时间不到 1 秒时，检查点增加复杂性但收益很小
快速变化的状态——整个状态在检查点之间都变了，快照和重放 WAL 一样昂贵
分布式状态——跨节点协调一致性检查点需要分布式快照协议（Chandy-Lamport）

八、参考资料#

PostgreSQL 检查点机制 - 数据库检查点后台进程实现
Redis RDB 持久化 - fork + COW 的非阻塞快照
Apache Flink 分布式快照 - Chandy-Lamport 算法的工程实现
etcd 快照机制 - Raft 日志压缩与定期快照
SQLite WAL 检查点 - 轻量级数据库的 WAL 检查点协议