摘要#

线性回归是机器学习中最基础、也是最重要的监督学习模型之一,它不仅是理解后续复杂神经网络的起点,也为优化方法、损失函数以及模型训练提供了最直观的数学框架。本章从最经典的回归问题出发,逐步构建线性回归模型的理论基础与工程实现,使读者能够从“问题定义—模型建立—参数求解—模型评估”的完整链路理解机器学习的基本范式。

本章首先介绍线性回归模型的基本假设与建模思想,说明如何通过线性函数对输入特征与目标变量之间的关系进行建模,并进一步推导模型的参数求解方法。在此基础上,引入 sklearn 等主流机器学习工具库,通过实际代码示例帮助读者快速实现线性回归模型,加深对理论与实践结合的理解。同时,本章还扩展到多变量线性回归与多项式回归,展示线性模型在高维特征与非线性关系建模中的扩展能力,使读者理解“线性模型并非只能处理线性问题”的核心思想。

在模型评估部分,本章系统介绍回归任务中的常见评价指标,如均方误差(MSE)、平均绝对误差(MAE)等,并通过代码示例展示如何在实际任务中进行模型性能评估与比较。此外,本章进一步引入梯度下降算法,从几何意义出发解释方向导数与梯度的概念,并将其与模型优化过程紧密联系。在此基础上,通过正态分布的引入解释最大似然估计与损失函数之间的关系,从概率角度重新审视线性回归的数学本质。

最后,本章对线性回归的目标函数进行系统推导,展示从理论表达式到梯度计算再到向量化实现的完整过程,并通过“从零实现线性回归模型”的实践案例,帮助读者建立对模型训练全过程的直观理解。通过本章学习,读者不仅能够掌握线性回归的理论与代码实现,更能够理解机器学习模型背后的优化思想与数学基础,为后续更复杂的神经网络模型学习奠定坚实基础。

本章内容

2.1 模型的建立与求解

在本节内容中,我们首先通过一个实际的场景介绍了什么是线性回归,接着介绍了如何建立一个简单的线性模型,然后引导读者如何将模型的求解问题转换为目标函数的最小化问题,最后通过开源框架sklearn搭建了一个简单的线性回归模型并进行了求解。

2.2 多变量线性回归

多变量线性回归教程,讲解多特征建模思路、参数求解过程,以及 sklearn 的训练与预测示例。

2.3 多项式回归

在本节内容中,我们首先以两个示例来分别介绍了多变量线性回归和多项式回归,然后通过sklearn对模型进行了求解,最后,我们通过一个梯形面积的求解示例和读者一起领略了算法的魅力所在。在2.4节中,我们将开始对模型的评估进行介绍。

2.4 回归模型评估

在本节中,我们详细地介绍了如何评价一个回归模型的优与劣,以及一些常用的评估指标和实现方法。最后,我们还通过波士顿房价预测示例来展示了评价指标的用法。到此,对于线性回归模型在整个阶段一部分的内容就介绍完了。

2.5 梯度下降

在2.1.3节中,我们不假思索地直接给出了线性回归模型的目标函数$J(w,b)$,但并没有给出严格的数学定义。同时,在求解的过程中也是直接通过开源框架sklearn实现,也不知道其内部的真正原理,因此,在这一节内容中我们将会仔细地学习目标函 …

2.6 正态分布

17、18世纪曾是科学发展的黄金年代,微积分的发展和牛顿万有引力定律的建立,直接推动了天文学和测地学的迅猛发展。这些天文学和测地学的问题,无不涉及数据的多次测量、分析与计算。很多年以前,学者们就已经经验性地认为,对于有误差的测量数据多次测量 …

2.7 目标函数推导

通过本节内容的学习,对于线性回归的主要内容就此结束了。对于其他细枝末节的地方(例如学习率的选择、特征标准化等),将在后续模型改善部分再进行介绍。