AI Agent 实战指南系列导读

系列简介#

AI Agent（智能体）是继 ChatGPT 之后，大语言模型最重要的应用方向。与简单的问答不同，Agent 能够自主规划、调用工具、与环境交互，完成复杂的多步骤任务。

本系列从基础概念出发，深入讲解 Agent 的核心机制，并紧跟最新研究进展，涵盖：

核心机制：规划架构、记忆系统、工具调用、多智能体协作
开发框架：LangChain、AutoGen、CrewAI、OpenAI Agents SDK
协议标准：MCP（Model Context Protocol）
前沿论文：Generative Agents、Attention Residuals
最新进展：Kimi 注意力残差、OpenAI o 系列、DeepSeek R1、Claude 4、Gemini 2

学习路径#

1
第一阶段：入门
2
├── 01 Agent 基础概念
3
└── 02 ReAct 与规划架构
4

5
第二阶段：核心机制
6
├── 03 Memory 记忆系统
7
├── 04 ToolUse 工具调用
8
└── 05 Multi-Agent 多智能体协作
9

10
第三阶段：框架与协议
11
├── 06 Agent 框架对比
12
├── 07 MCP 协议解析
13
└── 08 Generative Agents 论文解析
14

15
第四阶段：实战
16
└── 09 Agent 实战项目
17

18
第五阶段：前沿进展 NEW
19
├── 10 注意力残差与 Kimi 架构创新
20
├── 11 推理模型与 OpenAI o 系列
21
├── 12 DeepSeek R1 与推理架构创新
22
└── 13 主流模型新进展（Claude 4 / Gemini 2）

系列文章#

0.1 基础与核心机制（01-05）#

文章	状态	简介
[Agent 基础概念：从 Chatbot 到智能体](./01-Agent 基础概念.md)	已发布	Chatbot vs Agent、感知-规划-执行-反思循环、ReAct 范式
[Agent 规划架构：ReAct、Plan-and-Execute 与 Reflexion](./02-ReAct 与规划架构.md)	已发布	ReAct 原理、Plan-and-Execute、Reflexion，三种架构对比
[Agent 记忆系统：短期、长期与向量数据库](./03-Memory 记忆系统.md)	已发布	上下文窗口、向量数据库、情景记忆、检索与压缩
[Agent 工具调用：Function Calling 与 Tool Use 实战](./04-ToolUse 工具调用.md)	已发布	Function Calling、Tool Schema、多工具协同、ReAct 融合
[Multi-Agent 多智能体协作：架构与通信模式](./05-MultiAgent 多智能体协作.md)	已发布	通信模式、协作架构、任务分解、A2A 协议

0.2 框架与协议（06-08）#

文章	状态	简介
[Agent 开发框架对比：LangChain、AutoGen、CrewAI 与 OpenAI SDK](./06-Agent 框架对比.md)	已发布	框架对比、选型建议、代码示例
[MCP 协议解析：Agent 的工具标准](./07-MCP 协议解析.md)	已发布	MCP 协议架构、JSON-RPC、工具定义、与 Function Calling 对比
[论文解读：Generative Agents 与虚拟社会](./08-GenerativeAgents 论文解析.md)	已发布	记忆流、反思机制、规划系统、虚拟小镇实验

0.3 实战项目（09）#

文章	状态	简介
[Agent 实战：从零构建一个研究助手 Agent](./09-Agent 实战项目.md)	已发布	完整项目实战、工具集成、记忆系统、多 Agent 协作

0.4 工程实践 NEW（10-16）#

文章	状态	简介
[Agent 架构模式：Handoffs、Fan-out、Supervisor](./14-Agent 架构模式.md)	已发布	交接模式、并行模式、路由模式
[Agent 评估体系：任务完成率、成本效率](./15-Agent 评估体系.md)	已发布	Benchmark、成本分析、LLM-as-Judge
[Agent 可观测性：日志、追踪、调试](./16-Agent 可观测性与调试.md)	已发布	LangSmith、OpenTelemetry、调试技巧
[Agent 成本优化：Token 节省、缓存策略](./17-Agent 成本优化.md)	已发布	Prompt 压缩、结果缓存、智能路由
[Agent 可靠性设计：重试、熔断、降级](./18-Agent 可靠性设计.md)	已发布	重试机制、限流保护、容错模式
[Agent 测试策略：单元到集成](./19-Agent 测试策略.md)	已发布	测试框架、模糊测试、回归测试
[Agent 安全防御：提示注入、工具投毒](./20-Agent 安全防御.md)	已发布	注入检测、输出验证、沙箱隔离

0.5 前沿进展（17-20）#

文章	状态	简介
[注意力残差与 Kimi 架构创新](./10-注意力残差与 Kimi 架构创新.md)	已发布	AttnRes 论文解读
[推理模型与 OpenAI o 系列](./11-推理模型与 OpenAI-o 系列.md)	已发布	o1/o3/o4、RLVR
[DeepSeek R1 与推理架构创新](./12-DeepSeek-R1 与推理架构创新.md)	已发布	GRPO、R1-Zero
主流模型新进展：Claude 4、Gemini 2	已发布	MCP、Agent 原生架构

核心技术点#

0.6 Agent 核心循环#

flowchart TD P["感知 Perceive"] --> O["观察 Observe"] O --> R["推理 Reason"] R --> A["行动 Act"] A --> P R --> REF["反思 Reflect"] REF --> R

0.7 主流架构对比#

架构	特点	适用场景
ReAct	推理与行动交替	工具调用、搜索
Plan-and-Execute	先规划后执行	复杂任务分解
Reflexion	自我反思改进	试错学习
AttnRes	注意力动态选择深层信息	极深网络

0.8 推理模型发展时间线#

timeline title LLM Reasoning Model Evolution 2024 : OpenAI o1-preview 2025 Q1 : OpenAI o1/o3 : DeepSeek R1 2025 Q2 : Claude 3.5 Sonnet 2025 Q3 : OpenAI o4-mini 2025 Q4 : Gemini 2.0 Flash Thinking 2026 Q1 : Claude 4 Opus/Sonnet : Gemini 2.5/3.1 Pro : Kimi AttnRes

0.9 框架对比#

框架	优点	缺点	适用场景
LangChain	功能全面、生态丰富	学习曲线陡峭	快速原型
AutoGen	多 Agent 对话原生	文档不完善	多 Agent 协作
CrewAI	Role-Based 设计直观	定制化有限	角色扮演场景
OpenAI SDK	官方支持、稳定性好	功能相对基础	官方生态

前置知识#

Python 基础
大语言模型基本概念（可参考 LLM 系列）
API 调用经验

系列	定位	关联内容
LLM 论文发展史	历史视角	ReAct 论文（10）、o 系列（11）、DeepSeek R1（12）、Kimi AttnRes（13）深入解读
LLM 安全漏洞发展史	安全专题	Agent 安全防御（16）、提示注入攻击原理
从零理解大语言模型	入门教程	LLM 基础概念、Prompt 工程、RAG、Function Calling

参考资源#

官方文档

OpenAI Agents SDK - OpenAI Agents SDK 官方文档
LangChain Agents - LangChain Agents 官方文档
AutoGen 文档 - AutoGen 文档相关文档
CrewAI 文档 - CrewAI 文档官方文档
MCP SDK - MCP SDK 相关文档

论文

ReAct: Synergizing Reasoning and Acting in Language Models - (Yao et al., 2022)
Generative Agents: Interactive Simulacra of Human Behavior - (Park et al., 2023)
Attention Residuals - (Kimi Team, 2026)
DeepSeek-R1 - (DeepSeek Team, 2025)
MRKL Systems: A Modular, Neuro-Symbolic Architecture - MRKL Systems: A Modular, Neuro-Symbolic Architecture 论文原文

开源项目

LangChain - LangChain GitHub 仓库
AutoGen - AutoGen GitHub 仓库
CrewAI - CrewAI GitHub 仓库
Attention-Residuals (Kimi) - Attention-Residuals (Kimi) GitHub 仓库

新闻来源

Kimi 发布 Attention Residuals：颠覆十年残差连接 - Kimi 发布 Attention Residuals：颠覆十年残差连接相关文档
OpenAI o3 发布公告 - OpenAI o3 发布公告相关文档
Anthropic Claude 4 发布 - Anthropic Claude 4 发布相关文档
Google Gemini 2.0 发布 - Google Gemini 2.0 发布相关文档
DeepSeek R1 开源公告 - DeepSeek R1 开源公告相关文档