通道数是一个重要的超参数,通常是会仔细设计的。
在之前,我们仅展示了单个输入和单个输出通道的简化例子。 这使得我们可以将输入、卷积核和输出看作二维张量。
当我们添加通道时,我们的输入和隐藏的表示都变成了三维张量。例如,每个RGB输入图像具有3 * h *w的形状。我们将这个大小为3的轴称为通道(channel)维度。
1. 多个输入通道
- 彩色图片可能有RGB三个通道
- 转换为灰度会丢失信息
如果有多个输入通道,每个通道都有一个卷积核,结果是所有通道卷积结果的和,输出是一个单通道。
2. 多个输出通道
对每一个输出通道,都有自己的三维卷积核。
3. 多个输入和输出通道
ps:多个输出通道会作为下一层的多个输入通道,因此输入通道核会去识别,再组合输入中的模式。
4. 1 * 1卷积层
Q:怎么理解1 * 1卷积层不识别空间信息?
A:经过1 * 1卷积核,每一个输出的元素它只看对应的输入的那一个像素,没有看周围的像素。
5. 二维卷积层
bias的个数和卷积核个数相同。
6. 总结
- 输出通道数是卷积层的超参数
- 每个输入通道有独立的二维卷积核,所有通道结果相加得到一个输出通道结果
- 每个输出通道有独立的三维卷积核