【吴恩达机器学习笔记】六、过拟合及正则化

news2025/10/27 10:34:56

✍个人博客：https://blog.csdn.net/Newin2020?spm=1011.2415.3001.5343
📣专栏定位：为学习吴恩达机器学习视频的同学提供的随堂笔记。
📚专栏简介：在这个专栏，我将整理吴恩达机器学习视频的所有内容的笔记，方便大家参考学习。
📝视频地址：吴恩达机器学习系列课程
❤️如果有收获的话，欢迎点赞👍收藏📁，您的支持就是我创作的最大动力💪

六、过拟合及正则化

1. 过拟合问题

在开始介绍这节课内容之前，我们先来看一个线性回归的例子。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Mf4W8nIJ-1669683155508)(吴恩达机器学习.assets/image-20211105123753222.png)]

左图我们发现，所用的假设函数是一条直线，所以无法很好拟合数据，这我们称之为欠拟合（高偏差），中图即是最理想的拟合曲线，而右图的曲线就显得十分扭曲，但它经过了所有的数据点，可我们最后还是不能用它去预测新的数据，这我们称之为过拟合（高方差），当然除了线性回归问题，逻辑回归同样可能会出现过拟合的现象。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-0qVHwqTb-1669683155511)(吴恩达机器学习.assets/image-20211105124601460.png)]

过拟合（Overfitting）

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-aXZ6JsNI-1669683155513)(吴恩达机器学习.assets/image-20211105124049027.png)]

这种问题，通常会出现在过量变量但数据过少的情况，J(θ)的值会接近于0，但却无法去预测新样本。

想要解决过拟合问题有下面两种方法：

减少变量的数量
- 可以人工的去选择一些可以删除的变量。
- 也可以用之后要讲到的算法模型，去自动筛选变量。
缺点：这种方法，可能会导致一些有用变量的丢失，失去了一些有效信息。
正则化（Regularization）
- 保留所有变量，但是减小量级（magnitude）或者参数θ_j的大小。
优点：这种方法可以很好地确保那些对y的预测有帮助的变量不会丢失。

2. 正则化

正则化（Regularization）

通过减小对结果没什么用的θ值使其值接近于零，从而弱化其对结果的影响，简化函数。

线性回归的正则化

其正则化的代价函数如下：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-PsPvLzVw-1669683155517)(吴恩达机器学习.assets/image-20211105133321077.png)]

在代价函数中表示正则化的是上图的公式中带λ的式子，因为不知道哪个参数会对结果产生影响，所以就交给模型去判断该减小哪个θ值，所以选择都进行减小。其中λ是用来平衡正则化式子与其左边优化式子的关系，而将θ平方是为了防止正负号影响结果。但是如果λ值过大的话，可能会使所有参数都趋于0，那得出的曲线就接近于一条曲线了。