摘要#
本书围绕“检索增强生成(RAG)与智能体(Agent)系统构建”这一核心主题展开,从基础概念到工程实践,逐步构建一套完整的现代大模型应用开发方法论。全书既涵盖大模型接入、向量检索与知识增强等基础能力,也深入讲解 Agent 架构设计、记忆机制与复杂任务编排,最终形成一个面向真实应用场景的系统化技术体系。
在第1章中,首先从 RAG 的提出背景与发展动机出发,解释其解决大模型“知识静态性”和“幻觉问题”的核心原因,并系统梳理 RAG 的整体流程框架,使读者建立从“生成模型”到“检索增强生成”的基本认知转变。该部分为后续所有技术模块提供统一的概念基础与设计视角。
第2章重点讲解大模型接入与使用方式,围绕 SDK 体系展开,介绍现代大模型服务化接口的设计范式,并以 DashScope 与千问模型为例,说明如何通过标准化 API 快速调用大模型能力。这一部分帮助读者掌握从“模型使用者”角度出发的工程接入能力,为构建应用系统打下基础。
第3章聚焦于 RAG 系统中的核心基础能力——文档处理与语义检索。内容涵盖文档加载与标准化、文本切分策略设计、向量数据库的构建与使用,并进一步引入 Qwen3 Embedding 模型与 Milvus 向量数据库,实现从文本到向量空间的语义映射与高效检索能力。通过语义搜索引擎的构建,读者将掌握 RAG 系统中“检索模块”的完整实现路径。
第4章进入 RAG 与 Agent 的结合阶段,系统讲解两步式 RAG 架构的实现方式,并引入 Function Calling、Tool 机制以及 ReAct 框架,使模型具备工具调用与推理能力。在此基础上,进一步结合 LangGraph 构建复杂 Agent 工作流,并通过重排序与两阶段检索优化系统性能,使 RAG 从“简单问答系统”升级为“可推理的智能体系统”。
第5章则重点讨论 Agent 的记忆机制与管理体系,包括短期记忆与长期记忆的设计方法、持久化存储策略以及遗忘机制。同时,通过 pgvector 向量数据库实现长期记忆检索,并结合 LangGraph 构建具备记忆能力的 Mini ChatGPT 助手,最终完成从基础 RAG 系统到完整对话智能体系统的演进路径。通过本书的学习,读者将能够从零构建一个具备检索能力、工具调用能力与记忆能力的现代大模型 Agent 系统。
章节导航
RAG 入门章节,讲解 RAG 是什么、为什么需要 RAG,以及知识库检索增强生成的整体流程。
大模型接入教程,介绍 SDK 与 API 的关系、DashScope 接口体系,以及通义千问模型调用方法。
RAG 基础能力教程,讲解文档标准化、文本切分策略、Embedding、Milvus 与语义检索系统构建。
Agent 开发核心章节,介绍两步式 RAG、Function Calling、LangChain Tool、ReAct、重排序与 LangGraph 实战。
Agent 记忆教程,讲解短期记忆、长期记忆、pgvector 配置、LangGraph Mini ChatGPT 与 create_agent 实践。