摘要#

在真实的人工智能应用场景中,数据往往并不单一存在于某一种形式之中,而是同时包含空间结构与时间依赖。例如文本数据既具有局部语义结构,又存在上下文顺序关系;视频数据则同时具备空间信息与时间演化特征。单一模型(如仅CNN或仅RNN)通常难以充分捕捉这类复杂数据的多维结构,因此,如何将不同类型的神经网络进行融合,成为提升模型表达能力的重要研究方向。本章将围绕时序建模与模型融合方法展开,介绍多种经典混合网络结构,帮助读者理解如何结合CNN与RNN的优势来构建更强大的模型。

本章首先介绍 TextCNN 与 TextRNN 两种经典文本建模方法,分别从卷积视角与循环视角解释文本特征提取机制,使读者理解局部模式与序列依赖在文本任务中的不同作用。在此基础上,将进一步介绍 CNN-RNN 融合结构,如 C-LSTM 与 BiLSTM-CNN,通过将卷积特征提取能力与循环序列建模能力结合,实现对文本与序列数据更全面的表示学习。随后,本章将拓展到更复杂的时序数据建模任务,介绍 ConvLSTM 网络,分析其如何将卷积操作引入循环结构,从而同时处理空间与时间维度的信息,并结合 KTH 动作识别数据集展示其在视频理解任务中的应用方式。

在更高维度的时空建模方法中,本章还将介绍 3DCNN 网络,说明其通过三维卷积直接建模视频数据中的时空特征,从而避免手工拆分时间与空间结构的问题。同时,本章将进一步讲解 STResNet 网络,结合交通流量预测等实际任务,分析其如何融合残差网络与时空依赖建模机制,以提升对复杂时空数据的预测能力。通过本章学习,读者将掌握多种时序与结构融合模型的设计思想,理解不同网络在空间与时间建模中的分工与协同方式,并为后续学习现代 Transformer 与大模型中的统一建模范式奠定基础。

本章内容

8.1 TextCNN网络

在本节内容中,我们首先详细介绍了TextCNN的原理,其本质上可以看作是利用卷积操作来对序列数据进行局部特征提取的方法;然后简单介绍了分词的工具jieba的使用方法;最后介绍了如何一步一步实现TextCNN模型并在头条数据集上进行了测试。

8.2 TextRNN网络

在本节内容中,我们首先介绍了TextRNN的基本思想,即一系列以RNN模型为基础所构造的一类模型的总称;然后详细介绍了模型具体的构造原理;最后一步一步介绍了如何从零实现TextRNN模型,并同时进行了实验示例。

8.3 CNN-RNN网络

在前面两节内容中,我们分别介绍了通过CNN和RNN来对文本数据进行特征提取的建模方法,前者是从序列局部的角度来捕捉文本序列前后之间的依赖关系,而后者则是利用了RNN固有的特性来对序列数据进行特征提取。总的来说两者各有优势,在提取特征方面有不 …

8.4 ConvLSTM网络

在8.3节内容中,我们介绍了几种将CNN和RNN进行结合的时序模型,包括串行的方式将CNN和RNN进行结合、以并行的方式将CNN和RNN进行结合。同时,在这些任务场景中序列样本所拥有的一个共同特点便是对于每个序列中的每个时刻来说,其特征表示 …

8.5 3DCNN网络

在8.4节内容中,我们详细介绍了一种用于对时空数据进行特征提取的ConvLSTM模型,其有效地结合了RNN和CNN各自的优点对输入数据在时间和空间两个维度进行建模。在接下来的这节内容中将会介绍另外一种拓展自传统卷积网络的3D卷积模型来对时空 …

8.6 STResNet网络

在前面几节内容中, 我们陆续介绍了多种通过结合CNN和RNN的模型来对时序数据进行建模,并且从第8.4节内容开始还首次引入了基于时空数据相关任务。不管是8.4节中介绍的ConvLSTM模型还是8.5节中引入的3DCNN模型,为了能同时提取时 …