摘要#

在深度学习的发展过程中,卷积神经网络(CNN)是计算机视觉领域最具代表性的技术突破之一。与传统全连接神经网络不同,CNN 通过引入局部连接与权重共享机制,有效降低了模型参数规模,并显著提升了对图像空间结构的建模能力。图像数据本质上具有高度的空间相关性,而卷积操作正是针对这种结构特征设计的高效表示方法。本章将围绕卷积神经网络的核心思想展开,从最基础的卷积运算出发,逐步深入到现代经典网络结构,帮助读者建立从“卷积是什么”到“为什么CNN有效”的完整认知体系。

本章首先介绍卷积的基本概念,从深度学习的整体建模思想出发,解释卷积操作如何通过局部感受野提取局部特征,以及权重共享如何减少参数冗余并提升泛化能力。在此基础上,将进一步讲解卷积的计算过程,包括多卷积核的作用、深度卷积的结构特点以及特征图的生成机制,使读者能够从计算层面理解CNN的前向传播过程。随后,本章将系统介绍填充与池化操作,分析它们在控制特征图尺寸、增强平移不变性以及降低计算复杂度方面的作用,并通过示例代码帮助读者掌握基础实现方法。

在网络结构部分,本章将依次介绍多个具有里程碑意义的经典卷积神经网络模型,包括 LeNet5、AlexNet、VGG、NIN、GoogLeNet、ResNet 以及 DenseNet。这些模型不仅代表了CNN发展的不同阶段,也体现了深度学习从“加深网络层数”到“优化信息流与梯度传播”的演进路径。通过分析这些网络的设计动机与结构创新,读者可以清晰理解卷积神经网络在不同历史阶段所解决的核心问题,例如特征表达能力不足、梯度消失、计算效率限制以及特征复用等。完成本章学习后,读者不仅能够掌握CNN的基本构建方法,还能够理解现代视觉模型设计的核心思想,为后续学习序列模型与Transformer结构打下重要基础。

本章内容

4.1 卷积的概念

在本节内容中,我们首先再次抛出了深度学习的理念,即对输入进行深度特征提取然后再进行后续相关任务;接着我们引出了对于图像处理相关模型来说其应该具备的4种基本特性;最后,通过比较全连接操作与卷积操作在对图片进行特征提取时的不同之处,来介绍了卷积 …

4.2 卷积的计算过程

在上一节内容中,我们详细介绍了卷积操作的核心理念与思想,并通过对比全连接操作与卷积操作在识别同一元素的不同方式,进一步介绍了卷积操作的核心思想。但这仅仅只是对卷积操作有了一个总体的认识,其中仍有许多细节的地方没有进行介绍。例如:什么是多卷积 …

4.3 填充和池化

在本节内容中,我们首先介绍了什么是填充操作及其作用;然后详细介绍了卷积操作之后特征图形状的计算方法;接着介绍了什么是池化操作以及为什么需要池化操作等;最后分别介绍了如何借助PyTorch框架来快速完成卷积和池化操作的计算过程。

4.4 LeNet5网络

在本节内容中,我们首先介绍了LeNet5网络模型提出的动机;然后详细介绍了模型的网络结构及相关参数的详细信息和计算过程;最后一步步介绍了如何实现整个LeNet5网络模型,包括模型的前向传播、模型参数查看、模型训练和推理等。

4.5 AlexNet网络

AlexNet 网络详解,讲解模型结构、参数规模、ReLU 与 Dropout 等关键设计,以及 PyTorch 实现方法。

4.6 VGG网络

经过4.4节和4.5节内容的介绍我们已经了解了LeNet5和AlexNet这两种卷积网络模型,但是总体上来说两者的网络结构几乎并没有太大的差别。在接下来的这节内容中,我们将会介绍卷积网络中的第3个经典模型VGG。

4.7 NIN网络

在本节内容中,我们首先介绍了NIN模型的提出动机;然后详细介绍了论文中所提出来的多层感知机卷积模块和全局平均池化的思想原理;最后我们还以CIFAR10数据集为例进行了实验。在下一节内容中,我们将开始介绍卷积网络中的第5个经典模型 …

4.8 GoogLeNet网络

在前面两节内容中我们分别介绍了VGG和NIN模型中基于自定义块来构建网络的思想,其核心观点均是认为传统的单一卷积操作很难提取到高级的抽象特征,因此需要重新构造新的基模块,例如VGG块和多层感知机卷积块。在接下来的这节内容中,我们将再次介绍另 …

4.9 ResNet网络

ResNet 原理详解,讲清残差连接如何缓解网络退化问题,以及残差块的结构与实现方式。

4.10 DenseNet网络

在4.9节内容中,我们详细介绍了ResNet模型的原理和实现方法,它的成功不仅解决了深度神经网络的退化问题而且在ImageNet等大型数据集上有着很好的表现,成为了深度学习领域的重要成果之一。因此,ResNet也为后续的网络设计提供了一种新 …