1651 字
5 分钟
AI Agent 实战指南系列导读
系列简介
AI Agent(智能体)是继 ChatGPT 之后,大语言模型最重要的应用方向。与简单的问答不同,Agent 能够自主规划、调用工具、与环境交互,完成复杂的多步骤任务。
本系列从基础概念出发,深入讲解 Agent 的核心机制,并紧跟最新研究进展,涵盖:
- 核心机制:规划架构、记忆系统、工具调用、多智能体协作
- 开发框架:LangChain、AutoGen、CrewAI、OpenAI Agents SDK
- 协议标准:MCP(Model Context Protocol)
- 前沿论文:Generative Agents、Attention Residuals
- 最新进展:Kimi 注意力残差、OpenAI o 系列、DeepSeek R1、Claude 4、Gemini 2
学习路径
第一阶段:入门├── 01 Agent 基础概念└── 02 ReAct 与规划架构
第二阶段:核心机制├── 03 Memory 记忆系统├── 04 ToolUse 工具调用└── 05 Multi-Agent 多智能体协作
第三阶段:框架与协议├── 06 Agent 框架对比├── 07 MCP 协议解析└── 08 Generative Agents 论文解析
第四阶段:实战└── 09 Agent 实战项目
第五阶段:前沿进展 NEW├── 10 注意力残差与 Kimi 架构创新├── 11 推理模型与 OpenAI o 系列├── 12 DeepSeek R1 与推理架构创新└── 13 主流模型新进展(Claude 4 / Gemini 2)系列文章
0.1 基础与核心机制(01-05)
| 文章 | 状态 | 简介 |
|---|---|---|
| [Agent 基础概念:从 Chatbot 到智能体](./01-Agent 基础概念.md) | 已发布 | Chatbot vs Agent、感知-规划-执行-反思循环、ReAct 范式 |
| [Agent 规划架构:ReAct、Plan-and-Execute 与 Reflexion](./02-ReAct 与规划架构.md) | 已发布 | ReAct 原理、Plan-and-Execute、Reflexion,三种架构对比 |
| [Agent 记忆系统:短期、长期与向量数据库](./03-Memory 记忆系统.md) | 已发布 | 上下文窗口、向量数据库、情景记忆、检索与压缩 |
| [Agent 工具调用:Function Calling 与 Tool Use 实战](./04-ToolUse 工具调用.md) | 已发布 | Function Calling、Tool Schema、多工具协同、ReAct 融合 |
| [Multi-Agent 多智能体协作:架构与通信模式](./05-MultiAgent 多智能体协作.md) | 已发布 | 通信模式、协作架构、任务分解、A2A 协议 |
0.2 框架与协议(06-08)
| 文章 | 状态 | 简介 |
|---|---|---|
| [Agent 开发框架对比:LangChain、AutoGen、CrewAI 与 OpenAI SDK](./06-Agent 框架对比.md) | 已发布 | 框架对比、选型建议、代码示例 |
| [MCP 协议解析:Agent 的工具标准](./07-MCP 协议解析.md) | 已发布 | MCP 协议架构、JSON-RPC、工具定义、与 Function Calling 对比 |
| [论文解读:Generative Agents 与虚拟社会](./08-GenerativeAgents 论文解析.md) | 已发布 | 记忆流、反思机制、规划系统、虚拟小镇实验 |
0.3 实战项目(09)
| 文章 | 状态 | 简介 |
|---|---|---|
| [Agent 实战:从零构建一个研究助手 Agent](./09-Agent 实战项目.md) | 已发布 | 完整项目实战、工具集成、记忆系统、多 Agent 协作 |
0.4 工程实践 NEW(10-16)
| 文章 | 状态 | 简介 |
|---|---|---|
| [Agent 架构模式:Handoffs、Fan-out、Supervisor](./14-Agent 架构模式.md) | 已发布 | 交接模式、并行模式、路由模式 |
| [Agent 评估体系:任务完成率、成本效率](./15-Agent 评估体系.md) | 已发布 | Benchmark、成本分析、LLM-as-Judge |
| [Agent 可观测性:日志、追踪、调试](./16-Agent 可观测性与调试.md) | 已发布 | LangSmith、OpenTelemetry、调试技巧 |
| [Agent 成本优化:Token 节省、缓存策略](./17-Agent 成本优化.md) | 已发布 | Prompt 压缩、结果缓存、智能路由 |
| [Agent 可靠性设计:重试、熔断、降级](./18-Agent 可靠性设计.md) | 已发布 | 重试机制、限流保护、容错模式 |
| [Agent 测试策略:单元到集成](./19-Agent 测试策略.md) | 已发布 | 测试框架、模糊测试、回归测试 |
| [Agent 安全防御:提示注入、工具投毒](./20-Agent 安全防御.md) | 已发布 | 注入检测、输出验证、沙箱隔离 |
0.5 前沿进展(17-20)
| 文章 | 状态 | 简介 |
|---|---|---|
| [注意力残差与 Kimi 架构创新](./10-注意力残差与 Kimi 架构创新.md) | 已发布 | AttnRes 论文解读 |
| [推理模型与 OpenAI o 系列](./11-推理模型与 OpenAI-o 系列.md) | 已发布 | o1/o3/o4、RLVR |
| [DeepSeek R1 与推理架构创新](./12-DeepSeek-R1 与推理架构创新.md) | 已发布 | GRPO、R1-Zero |
| 主流模型新进展:Claude 4、Gemini 2 | 已发布 | MCP、Agent 原生架构 |
核心技术点
0.6 Agent 核心循环
flowchart TD
P["感知 Perceive"] --> O["观察 Observe"]
O --> R["推理 Reason"]
R --> A["行动 Act"]
A --> P
R --> REF["反思 Reflect"]
REF --> R
0.7 主流架构对比
| 架构 | 特点 | 适用场景 |
|---|---|---|
| ReAct | 推理与行动交替 | 工具调用、搜索 |
| Plan-and-Execute | 先规划后执行 | 复杂任务分解 |
| Reflexion | 自我反思改进 | 试错学习 |
| AttnRes | 注意力动态选择深层信息 | 极深网络 |
0.8 推理模型发展时间线
timeline
title LLM Reasoning Model Evolution
2024 : OpenAI o1-preview
2025 Q1 : OpenAI o1/o3
: DeepSeek R1
2025 Q2 : Claude 3.5 Sonnet
2025 Q3 : OpenAI o4-mini
2025 Q4 : Gemini 2.0 Flash Thinking
2026 Q1 : Claude 4 Opus/Sonnet
: Gemini 2.5/3.1 Pro
: Kimi AttnRes
0.9 框架对比
| 框架 | 优点 | 缺点 | 适用场景 |
|---|---|---|---|
| LangChain | 功能全面、生态丰富 | 学习曲线陡峭 | 快速原型 |
| AutoGen | 多 Agent 对话原生 | 文档不完善 | 多 Agent 协作 |
| CrewAI | Role-Based 设计直观 | 定制化有限 | 角色扮演场景 |
| OpenAI SDK | 官方支持、稳定性好 | 功能相对基础 | 官方生态 |
前置知识
- Python 基础
- 大语言模型基本概念(可参考 LLM 系列)
- API 调用经验
相关系列
本系列是机器学习学习路线的重要组成部分,推荐结合以下系列阅读:
| 系列 | 定位 | 关联内容 |
|---|---|---|
| LLM 论文发展史 | 历史视角 | ReAct 论文(10)、o 系列(11)、DeepSeek R1(12)、Kimi AttnRes(13)深入解读 |
| LLM 安全漏洞发展史 | 安全专题 | Agent 安全防御(16)、提示注入攻击原理 |
| 从零理解大语言模型 | 入门教程 | LLM 基础概念、Prompt 工程、RAG、Function Calling |
阅读建议:
- 先学 从零理解大语言模型 建立基础认知
- 本系列专注 Agent 实战,论文细节可参考 LLM 论文发展史
- 构建生产级 Agent 时,务必关注 LLM 安全漏洞发展史
参考资源
官方文档
- OpenAI Agents SDK - OpenAI Agents SDK 官方文档
- LangChain Agents - LangChain Agents 官方文档
- AutoGen 文档 - AutoGen 文档 相关文档
- CrewAI 文档 - CrewAI 文档 官方文档
- MCP SDK - MCP SDK 相关文档
论文
- ReAct: Synergizing Reasoning and Acting in Language Models - (Yao et al., 2022)
- Generative Agents: Interactive Simulacra of Human Behavior - (Park et al., 2023)
- Attention Residuals - (Kimi Team, 2026)
- DeepSeek-R1 - (DeepSeek Team, 2025)
- MRKL Systems: A Modular, Neuro-Symbolic Architecture - MRKL Systems: A Modular, Neuro-Symbolic Architecture 论文原文
开源项目
- LangChain - LangChain GitHub 仓库
- AutoGen - AutoGen GitHub 仓库
- CrewAI - CrewAI GitHub 仓库
- Attention-Residuals (Kimi) - Attention-Residuals (Kimi) GitHub 仓库
新闻来源
- Kimi 发布 Attention Residuals:颠覆十年残差连接 - Kimi 发布 Attention Residuals:颠覆十年残差连接 相关文档
- OpenAI o3 发布公告 - OpenAI o3 发布公告 相关文档
- Anthropic Claude 4 发布 - Anthropic Claude 4 发布 相关文档
- Google Gemini 2.0 发布 - Google Gemini 2.0 发布 相关文档
- DeepSeek R1 开源公告 - DeepSeek R1 开源公告 相关文档
支持与分享
如果这篇文章对你有帮助,欢迎支持作者或分享给更多人
AI Agent 实战指南系列导读
https://blog.souloss.com/posts/ai/agent-guide/agent-guide-series-guide/ 部分信息可能已经过时
相关文章 智能推荐
1
从 Chatbot 到 Agent:打造能自主干活的 AI
AI 从 Chatbot 到 Agent——打造能自主干活的 AI
2
Agent 实战:从零构建一个研究助手 Agent
AI 手把手实战教程——使用 LangChain 从零构建一个完整的研究助手 Agent,包含工具集成、记忆系统、多 Agent 协作和部署方案。
3
LLM 核心论文发展史系列导读
AI 大语言模型论文发展史系列——从 Transformer 到最新架构创新,梳理 AI 领域的关键里程碑。
4
记忆、MCP 与 AI 生态组件
AI 记忆、MCP 与 AI 生态组件
5
定制专属模型:微调实战指南
AI 定制专属模型——微调实战指南






