摘要#
深度学习作为人工智能领域最具影响力的技术之一,已经广泛应用于计算机视觉、自然语言处理、语音识别、智能推荐、自动驾驶以及大模型等众多领域。从最初的感知机模型,到卷积神经网络、循环神经网络,再到近年来以 Transformer 为代表的现代神经网络,深度学习的发展历程既是一部算法不断演进的历史,也是一部计算能力、数据规模与工程实践共同推动技术突破的历史。对于初学者而言,直接学习复杂的网络结构和代码实现,往往容易陷入“知其然,而不知其所以然”的困境。因此,在正式进入模型学习之前,有必要先建立对深度学习发展脉络、核心思想以及整体技术体系的宏观认识,从更高的视角理解深度学习为什么会出现、如何发展,以及未来又将走向何方。
本章将作为全书的起点,首先回顾深度学习的发展历程,从早期神经网络理论、人工智能的发展浪潮,到反向传播算法、卷积神经网络、循环神经网络以及自然语言处理技术的兴起,帮助读者理解各项关键技术诞生的背景与意义。随后,本章将介绍推动深度学习发展的代表性人物及其重要贡献,使读者对整个领域的发展形成更加立体的认识。在此基础上,本章还将介绍主流深度学习框架的发展历史和设计理念,帮助读者理解为什么现代深度学习开发越来越依赖统一的计算框架。最后,本章将对本书的整体内容、章节安排、适用读者以及配套代码资源进行说明,使读者能够提前建立完整的学习路线,为后续环境搭建、模型实现、网络优化以及现代大模型的学习打下坚实基础。
本章内容
1.1 深度学习的发展阶段
本节围绕深度学习的发展阶段展开,重点介绍早期理论的发展、人工智能的萌芽和反向传播算法的发展等内容。
1.2 深度学习中的关键人物
本节围绕深度学习中的关键人物展开,系统介绍其核心概念与相关内容。
1.3 深度学习框架介绍
本节围绕深度学习框架介绍展开,重点介绍深度学习框架的出现与深度学习框架的历史等内容。