二分类
1. 核心定义
二分类任务是监督学习中最基础的问题类型,其目标是将样本划分为两个互斥类别。设样本特征空间为
X
⊆
R
n
\mathcal{X} \subseteq \mathbb{R}^n
X⊆Rn,输出空间为
Y
=
{
0
,
1
}
\mathcal{Y} = \{0,1\}
Y={0,1},学习目标为建立映射关系:
f
:
X
→
Y
f: \mathcal{X} \to \mathcal{Y}
f:X→Y
1.1以识别猫咪为例
在计算机中,这张图片需要三个矩阵进行表示,分别对应红、绿、蓝三种通道,如果它是一张像素为64的图片,则每个矩阵为64*64的矩阵,分别对应红、绿、蓝三种颜色的强度值。定义特征向量
x
\mathcal{x}
x来表示这张图片:把这三个向量中的所有像素取出放入同一个矩阵中,则这个特征向量的维度是64 * 64 * 3,也就是nx=64 * 64 * 3。
符号定义说明:
x
\mathcal{x}
x :表示一个输入数据,维度为(nx,1)
y
\mathcal{y}
y :表示一个输出结果,取值为(0,1)
(
x
(
i
)
,
y
(
i
)
\mathbf{x}^{(i)},\mathbf{y}^{(i)}
x(i),y(i)):表示第i组数据,此处默认为训练数据。(测试数据)
X=[
x
(
1
)
,
x
(
2
)
,
.
.
.
,
x
(
m
)
\mathbf{x}^{(1)},\mathbf{x}^{(2)},...,\mathbf{x}^{(m)}
x(1),x(2),...,x(m)]: 表示所有训练数据的输入值,放在一个(nx,m)的矩阵中。
Y=[
y
(
1
)
,
y
(
2
)
,
.
.
.
,
y
(
m
)
\mathbf{y}^{(1)},\mathbf{y}^{(2)},...,\mathbf{y}^{(m)}
y(1),y(2),...,y(m)]: 表示所有训练数据的输出值,放在一个(1,m)的矩阵中。
(
x
,
y
\mathcal{x},\mathcal{y}
x,y ):表示单个样本。
Mtrain:表示由m个单独的样本组成训练集; {(
x
(
1
)
,
y
(
1
)
\mathbf{x}^{(1)},\mathbf{y}^{(1)}
x(1),y(1)),
x
(
2
)
,
y
(
2
)
\mathbf{x}^{(2)},\mathbf{y}^{(2)}
x(2),y(2),…,
x
(
m
)
,
y
(
m
)
\mathbf{x}^{(m)},\mathbf{y}^{(m)}
x(m),y(m)};(Mtest)