机器学习的数学基础：假设检验

news2026/2/25 23:55:47

假设检验

默认以错误率为性能度量，错误率由下式给出：

$E(f,\mathcal{D})=\int_{\boldsymbol{x}\sim \mathcal{D}}\mathbb{II}(f(\boldsymbol{x})\ne y )p(\boldsymbol{x})\text{d}\boldsymbol{x}$

假设检验中的"假设"是对学习泛化错误率分布的某种判断或者猜想，例如:

$\varepsilon=\varepsilon_0$

其中，我们 $\varepsilon_0$ 为测试错误率是已知的。

对单个学习器泛化能力的假设检验

对于一个样本上的留出法得到的错误率 $\varepsilon_0$ ,这意味着 $m$ 个测试样本中，恰好有 $m\times \varepsilon_0$ 个错误分类。假设测试样本是从总体中独立同分布采样获得，那么泛化错误率为 $\varepsilon$ 的学习器，将其中 $m\times \varepsilon_0$ 个分类错误，其余分类正确的概率为:

单次留出法
$P(\varepsilon;\varepsilon_0)=\binom{m}{m\times \varepsilon_0}\varepsilon^{\varepsilon_0\times m}(1-\varepsilon)^{m-\varepsilon_0 \times m}$

所以由极值条件得到：

$\frac{\partial P}{\partial \varepsilon}=0$

然后选取一个显著性水平 $\alpha$ ，对于 $\varepsilon \sim B(m,\varepsilon_0)$ ,我们假设 $\varepsilon\leq\varepsilon^{\prime}$ ,满足：

$$
\overline{\varepsilon}=\min \varepsilon

\mathbf{s.t.}:
\sum_{i=\varepsilon^{\prime}\times m+1}^{{m}\binom{m}{i}\varepsilon}{i}(1-\varepsilon)^{m-i}
$$

若此时 $\varepsilon \leq \overline{\varepsilon}$ 则有 $1-\alpha$ 的概率认为，学习器的泛化错误率不大于 $\varepsilon^{\prime}$ 。

多次留出法或交叉验证法

类似的，假定我们得到了 $k$ 个测试错误率， $\hat{\varepsilon}_1$ , $\hat{\varepsilon}_2$ , $\cdots$ , $\hat{\varepsilon}_k$ ,则平均测试错误率 $\mu$ 和方差 $\sigma^2$ 分别为：

$\mu=\frac{1}{k}\sum_{i=1}^{k}\hat{\varepsilon}_i$

$\sigma^2=\frac{1}{k-1}\sum_{i=1}^{k}(\hat{\varepsilon}_i-\mu)^2$
其中有假设：
每个测试错误率 $\hat{\varepsilon}_1, \hat{\varepsilon}_2, \ldots, \hat{\varepsilon}_k$ 必须是独立同分布（independent and identically distributed, i.i.d.）的随机变量。且样本量足够大或者它们服从正态分布。

则：

$\tau_t=\frac{(\mu-\varepsilon_0)}{\frac{\sigma}{\sqrt{k}}}\sim t(k-1)$

对两个学习器泛化能力的假设检验

对于两个学习器 $A$ 和 $B$ ，使用 $k$ 折交叉验证法得到： $\varepsilon_{1}^A$ , $\varepsilon_{2}^A$ , $\dots$ $\varepsilon_{k}^A$ 和 $\varepsilon_{1}^B$ , $\varepsilon_{2}^B$ , $\dots$ $\varepsilon_{k}^B$