摘要#

随着大语言模型能力的快速提升,如何将其与外部知识库、工具调用以及复杂任务规划能力结合,已经成为构建智能应用的核心方向。本章围绕 RAG(Retrieval-Augmented Generation)与 Agent 两大关键技术展开,从基础实现到工程化框架逐步深入,帮助读者建立“检索增强 + 工具调用 + 多步推理”的完整系统设计思维。

本章首先从最基础的两步式 RAG 系统入手,讲解如何将大模型与向量数据库进行结合,通过“检索 + 生成”的方式提升模型在特定知识领域中的回答能力。读者将学习如何实例化大模型与向量库、构建语义检索与提示词模板,并最终完成一个完整的问答流程。在此基础上,本章进一步引入 Function Calling 机制,解释大模型如何突破纯文本生成限制,主动调用外部工具完成结构化任务,从而显著降低幻觉问题并提升系统可靠性。

在工具化能力扩展部分,本章介绍 LangChain 中的 Tool 修饰器机制,说明如何通过统一的 Schema 定义实现工具自动化封装与调用编排,使模型能够以标准化方式访问外部能力。同时,本章进一步上升到 RAG Agent 的系统级设计,讲解如何将检索模块与决策模块结合,使模型能够根据问题动态选择是否检索、如何检索以及如何生成最终答案,从而形成更智能的推理闭环。

在复杂任务处理方面,本章重点引入 ReAct 框架,系统分析其“推理—行动交替”的核心思想,并说明其在多步决策与工具调用中的优势。同时,通过对双塔与单塔结构的对比分析,引出重排序(Reranking)与两阶段检索策略,进一步提升检索质量与生成效果,并结合 Qwen3 Reranking 模型展示工业级检索优化方案。

最后,本章结合 LangGraph 框架,从图结构视角重新审视 RAG Agent 的构建方式,通过共享状态、节点与边的抽象,实现更加灵活、可扩展的智能体流程编排,并最终构建一个具备检索增强、质量评估与动态决策能力的完整 RAG Agent 系统。通过本章学习,读者将从“单点RAG实现”迈向“可编排智能体系统设计”,掌握现代大模型应用的核心工程范式。

本章内容

4.1 两步式 RAG 搭建

在本小节中,我们详细介绍了 RAG 应用开发中最简单的两步式 RAG 流程,包括向量检索、提示词构建及结果生成等。不过大家有没有发现这样的问题:① 无论用户提什么样的问题它都会固定去知识库做检索,然后将其喂入大模型生成回答,哪怕是用户的打招 …

4.2 Function Calling 概念介绍

到此,对于 Function Calling 的基本原理及使用方式就介绍完了,包括什么是大模型中的幻觉、Function Calling 的定义与使用流程等。但是大家有没有发现一个问题?整个过程有点繁琐,需要我们自己实现的内容太多。那有没有 …

4.3 LangChain 中的 Tool 修饰器

本节围绕LangChain 中的 Tool 修饰器展开,重点介绍工具自动化生成、输出 Schema 及测试和编排自动化等内容。

4.4 RAG Agent 原理与搭建

RAG Agent 教程,讲清检索增强、工具调用和语义检索工具封装,理解完整的 Agent 搭建流程。

4.6 RAG 中的两阶段索引

本节围绕RAG 中的两阶段索引展开,重点介绍双塔结构思想原理、双塔结构的优势与不足和单塔结构思想原理等内容。

4.7 Qwen3 Reranking 原理与使用

本节围绕Qwen3 Reranking 原理与使用展开,重点介绍Qwen3 Reranking 原理、Qwen3 Reranking 使用和Qwen3 Reranking 实现等内容。

4.9 LangGraph 基本概念介绍

本节围绕LangGraph 基本概念介绍展开,重点介绍LangGraph 的核心思想、图中的共享状态和图中的节点等内容。