摘要#

本书围绕“检索增强生成（RAG）与智能体（Agent）系统构建”这一核心主题展开，从基础概念到工程实践，逐步构建一套完整的现代大模型应用开发方法论。全书既涵盖大模型接入、向量检索与知识增强等基础能力，也深入讲解 Agent 架构设计、记忆机制与复杂任务编排，最终形成一个面向真实应用场景的系统化技术体系。

在第1章中，首先从 RAG 的提出背景与发展动机出发，解释其解决大模型“知识静态性”和“幻觉问题”的核心原因，并系统梳理 RAG 的整体流程框架，使读者建立从“生成模型”到“检索增强生成”的基本认知转变。该部分为后续所有技术模块提供统一的概念基础与设计视角。

第2章重点讲解大模型接入与使用方式，围绕 SDK 体系展开，介绍现代大模型服务化接口的设计范式，并以 DashScope 与千问模型为例，说明如何通过标准化 API 快速调用大模型能力。这一部分帮助读者掌握从“模型使用者”角度出发的工程接入能力，为构建应用系统打下基础。

第3章聚焦于 RAG 系统中的核心基础能力——文档处理与语义检索。内容涵盖文档加载与标准化、文本切分策略设计、向量数据库的构建与使用，并进一步引入 Qwen3 Embedding 模型与 Milvus 向量数据库，实现从文本到向量空间的语义映射与高效检索能力。通过语义搜索引擎的构建，读者将掌握 RAG 系统中“检索模块”的完整实现路径。

第4章进入 RAG 与 Agent 的结合阶段，系统讲解两步式 RAG 架构的实现方式，并引入 Function Calling、Tool 机制以及 ReAct 框架，使模型具备工具调用与推理能力。在此基础上，进一步结合 LangGraph 构建复杂 Agent 工作流，并通过重排序与两阶段检索优化系统性能，使 RAG 从“简单问答系统”升级为“可推理的智能体系统”。

第5章则重点讨论 Agent 的记忆机制与管理体系，包括短期记忆与长期记忆的设计方法、持久化存储策略以及遗忘机制。同时，通过 pgvector 向量数据库实现长期记忆检索，并结合 LangGraph 构建具备记忆能力的 Mini ChatGPT 助手，最终完成从基础 RAG 系统到完整对话智能体系统的演进路径。通过本书的学习，读者将能够从零构建一个具备检索能力、工具调用能力与记忆能力的现代大模型 Agent 系统。

大模型Agent开发

摘要#

章节导航

第 1 章 RAG 基础概念

第 2 章大模型接入与使用

第 3 章文档标准化与语义检索

第 4 章 RAG 与 Agent

第 5 章 Agent 记忆机制与管理

摘要#