摘要#

深度学习作为人工智能领域最具影响力的技术之一，已经广泛应用于计算机视觉、自然语言处理、语音识别、智能推荐、自动驾驶以及大模型等众多领域。从最初的感知机模型，到卷积神经网络、循环神经网络，再到近年来以 Transformer 为代表的现代神经网络，深度学习的发展历程既是一部算法不断演进的历史，也是一部计算能力、数据规模与工程实践共同推动技术突破的历史。对于初学者而言，直接学习复杂的网络结构和代码实现，往往容易陷入“知其然，而不知其所以然”的困境。因此，在正式进入模型学习之前，有必要先建立对深度学习发展脉络、核心思想以及整体技术体系的宏观认识，从更高的视角理解深度学习为什么会出现、如何发展，以及未来又将走向何方。

本章将作为全书的起点，首先回顾深度学习的发展历程，从早期神经网络理论、人工智能的发展浪潮，到反向传播算法、卷积神经网络、循环神经网络以及自然语言处理技术的兴起，帮助读者理解各项关键技术诞生的背景与意义。随后，本章将介绍推动深度学习发展的代表性人物及其重要贡献，使读者对整个领域的发展形成更加立体的认识。在此基础上，本章还将介绍主流深度学习框架的发展历史和设计理念，帮助读者理解为什么现代深度学习开发越来越依赖统一的计算框架。最后，本章将对本书的整体内容、章节安排、适用读者以及配套代码资源进行说明，使读者能够提前建立完整的学习路线，为后续环境搭建、模型实现、网络优化以及现代大模型的学习打下坚实基础。

第 1 章深度学习发展史与主流框架介绍

摘要#

本章内容

1.1 深度学习的发展阶段

1.2 深度学习中的关键人物

1.3 深度学习框架介绍