390 字
1 分钟
AI 工程深化系列导读
本系列聚焦 AI 工程实践中容易一略而过、但深度值得专门展开的主题。每个主题都是实战中绕不开的环节,我们不只是讲”是什么”,更关注”怎么做”和”为什么这样做”。
系列定位
本系列是 “从零理解大语言模型” 的工程深化篇。入门系列覆盖了 RAG、微调、Agent 等基础概念,本系列则针对以下方向做深度展开:
- Embedding 与向量搜索:理解语义表示的底层原理
- 向量数据库:主流产品对比与选型指南
- RAG 优化:从检索质量到生成质量的系统化提升
- 模型服务化:从推理框架到生产部署的完整链路
文章列表
| 序号 | 标题 | 核心问题 |
|---|---|---|
| 01 | Embedding 与向量搜索 | 如何将文本转化为可计算的语义表示? |
| 02 | 向量数据库深度解析 | Milvus、Qdrant、Pinecone……怎么选? |
| 03 | RAG 优化策略深度解析 | 检索不准、回答跑偏,怎么系统性改善? |
| 04 | 模型服务化 | 训练完了,怎么上线? |
阅读建议
- 如果你在做 RAG 应用,建议按 01 → 02 → 03 的顺序阅读
- 如果你关注推理部署,可以直接从 04 开始
- 本系列与 “从零理解大语言模型” 互补,建议先读过入门系列再做深度探索
支持与分享
如果这篇文章对你有帮助,欢迎支持作者或分享给更多人
部分信息可能已经过时
相关文章 智能推荐
1
让 AI 拥有知识:RAG 检索增强生成详解
AI 让 AI 拥有知识——RAG 检索增强生成详解
2
Embedding 与向量搜索原理
AI 深入解析文本 Embedding 模型与向量检索——模型原理、索引结构、相似度计算与工程实践。
3
向量数据库深度解析
AI 深入解析主流向量数据库的架构原理、性能对比与选型指南,涵盖 Milvus、Qdrant、Pinecone、Chroma、Weaviate。
4
RAG 优化策略深度解析
AI 深入解析 RAG 检索增强生成的优化策略——Query 改写、混合检索、重排序、Context 压缩与引用追踪。
5
AI Agent 实战指南系列导读
AI AI Agent 实战指南系列——从基础概念到项目实战,手把手教你构建智能体应用,涵盖最新大模型架构创新。






