1. 权重衰退
- 最常见的用来处理过拟合的方法
- 使用均方范数作为硬性限制
  
- 使用均方范数作为软性限制
  
总结:
 正则化是处理过拟合的常用方法:在训练集的损失函数中加入惩罚项,以降低学习到的模型的复杂度。
 保持模型简单的一个特别的选择是使用L2惩罚的权重衰减。这会导致学习算法更新步骤中的权重衰减。
 权重衰减功能在深度学习框架的优化器中提供。
 在同一训练代码实现中,不同的参数集可以有不同的更新行为。
2. dropout
 dropout在前向传播过程中,计算每一内部层的同时丢弃一些神经元。
 dropout可以避免过拟合,它通常与控制权重向量的维数和大小结合使用的。
 dropout将活性值h替换为具有期望值h的随机变量。
 dropout仅在训练期间使用。
Q&A
 dropout是在全连接层上使用



















