【数字图像处理】

第一章概述

1.1 什么是数字图像？

图像分为两大类：模拟图像与数字图像

模拟图像：通过某种物理（光、电）的强弱变化来记录图像上各个点的亮度信息

连续：从空间上和数值上是不间断的
举例：胶卷照片、纸质照片、肉眼看见的图像

数字图像：模拟图像经过采样和量化后得到的图像

数字化意味着数字图像只是真实图像的近似，在数字化过程有信息损失（是为了方便计算机处理才做的采样和量化）
举例：数码相机储存的图像
像素值通常表示灰度、颜色、不透明度等

        图像的采样和量化是数字图像处理的两个基本步骤，主要用于将模拟图像（如自然世界中的连续图像）转换为数字图像（即计算机可处理的图像）

一、采样（Sampling）

定义：

        采样是指在图像的空间域中对连续图像进行空间上的离散化，也就是在图像中选取一些特定的位置（点）来代表整个图像。

通俗理解：
        就像你拿相机拍照，感光元件上每个像素点都在采集一个位置的信息，最终得到一张由很多像素点组成的图像。

举例说明：

一幅图像的分辨率是 1920×1080，这表示图像在水平方向被采样了1920次，垂直方向采样了1080次。

如果采样率低，图像就会显得模糊、马赛克严重。

二、量化（Quantization）

定义：
        量化是指将每个采样点的像素值（通常是灰度值或颜色值）从连续的模拟值转化为有限的离散数值等级。

通俗理解：
        现实世界中的亮度、颜色变化是连续的，但计算机只能表示有限数量的数字。因此必须把这些连续值四舍五入到最近的离散值。

举例说明：

灰度图像中，如果使用8位来表示灰度值，就有 2^8 = 256个灰度等级。

如果量化等级太少（如只用2位=4个灰度级），图像就会出现色带（伪影），失去细节。

三、采样 vs 量化对比

项目采样量化
涉及的维度空间维度（横纵坐标）灰度或颜色值
作用选取图像中的像素点将每个像素值转化为整数级别
结果影响图像的分辨率影响图像的灰度层次或色彩精度

拍照时，“你拍了多少个点”是采样，“你对每个点的颜色记录得有多精细”是量化。

项目	采样	量化
涉及的维度	空间维度（横纵坐标）	灰度或颜色值
作用	选取图像中的像素点	将每个像素值转化为整数级别
结果	影响图像的分辨率	影响图像的灰度层次或色彩精度

1.2数字图像处理的基本流程

图像获取
通过传感器（如相机、扫描仪、MRI设备）将现实世界的模拟图像转换为数字信号（采样+量化）。
预处理
增强：调整对比度、降噪、锐化（如直方图均衡化、滤波）。校正：消除几何畸变、色彩偏差（如镜头畸变修正）。
特征提取
检测边缘、纹理、形状或特定目标（如SIFT特征、霍夫变换）。
分析与识别
分类（如人脸识别）、分割（如医学图像中的肿瘤区域）、测量（如细胞计数）。
输出与可视化
生成处理后的图像、数据报告或控制指令（如自动驾驶中的障碍物标记）。

1.3 数字图像处理的发展趋势

Ø 从低分辨率向高分辨率发展
Ø 从二维（2D）向三维（3D）发展
Ø 从静止图像向动态图像发展
Ø 从单态图像向多态图像发展
Ø 从图像处理向图像理解发展

第二章基础知识

2.1 图像的数字化

采样 →M*N矩阵
量化→连续函数f(x,y)被划分为K个空间
采样及量化越精细（M，N，K越大），越逼近连续图像

2.2 图像的表示

2.3 图像模式及彩色模型

图像模式：

二值图像：指图像中的每个像素点只有 两种可能的取值（通常为 0 和 1），分别对应黑色和白色（或其他两种颜色的组合）。
灰度图像：灰度图像中每个像素点的取值表示 亮度（明暗程度），通常范围为 0（黑色）到 255（白色），共 256 级灰度（8 位二进制数。灰度图像可以保留亮度信息：能体现图像的明暗层次，但不包含颜色信息。

彩色图像：彩色图像通过不同颜色通道的组合来表示像素的颜色。每个像素通常占用 3 字节（RGB 三通道各 1 字节），存储和处理成本较高。

常用的彩色模型：

彩色模型（颜色空间）用于以数学方式描述颜色。

1. RGB（Red, Green, Blue）

原理：基于光的三原色叠加（加色模型）。
表示：
- 三维坐标 (R, G, B)，每通道范围通常为 0~255（8位）。
- 黑色：(0, 0, 0)；白色：(255, 255, 255)。、
特点：
- 直接对应显示器/传感器的物理输出。
- 颜色与亮度耦合，调整单一通道会影响亮度和色相。
- 等比例混合时（如 R=G=B）呈现灰度色（如 R=G=B=128 为灰色）。

2.HSI 彩色模型（Hue-Saturation-Intensity）

原理

基于人类视觉感知：将颜色分解为三个直观的分量：
- 色调（Hue, H）：颜色的种类（如红、绿、蓝），取值范围通常为 0°-360°（对应色轮圆周）。
- 饱和度（Saturation, S）：颜色的纯度（鲜艳程度），取值范围 0%-100%（0% 为灰度色，100% 为纯色）。
- 亮度（Intensity, I）：颜色的明暗程度，取值范围 0%-100%（0% 为黑色，100% 为白色）。
  亮度定义 三通道平均值（Intensity，平均亮度）

特点

解耦颜色属性：H、S、I 三个分量相互独立，便于单独调整（如调节亮度不影响色调）。
与 RGB 可相互转换：通过数学公式实现转换，但计算复杂度较高。

3.HSV 彩色模型（Hue-Saturation-Value）

RGB：基于光的三原色叠加，适用于显示器存储。
HSV：基于人眼感知，分离色相（H）、饱和度（S）、明度（V），更适合颜色调整和图像分析。

原理

类似 HSI 的变体：
- 色调（H）：与 HSI 的 H 含义相同（0°-360°）。
- 饱和度（S）：与 HSI 的 S 含义相同（0%-100%）。
- 明度（Value, V）：对应颜色的 最大亮度（与 HSI 的亮度 I 略有差异），取值范围 0%-100%（0% 为黑色，100% 为纯色最亮状态）

亮度定义

三通道最大值（Value，最大亮度

4.YCrCb（Luminance-Chrominance）

原理：分离亮度（Y）和色度（Cr, Cb），基于人眼对亮度更敏感的特性。
表示：
- Y：亮度（类似灰度）。
- Cr：红色分量与亮度的差值。
- Cb：蓝色分量与亮度的差值。
特点：
- 色度信息可压缩（如JPEG压缩时降低Cr/Cb分辨率）。
- 兼容黑白显示（仅需Y通道）

5.Lab 彩色模型（CIE L*a*b*）

原理

设备无关的感知模型：由国际照明委员会（CIE）定义，基于人类视觉的 均匀颜色空间，理论上能覆盖人眼可见的所有颜色。
三个分量：
- L（亮度）：取值范围 0-100（0 为黑色，100 为白色）。
- a（红绿轴）：取值范围 -128-127（负值为绿色，正值为红色）。
- b（蓝黄轴）：取值范围 -128-127（负值为蓝色，正值为黄色）。

特点

最接近人类视觉：颜色空间均匀分布，任意两点间的欧氏距离对应人眼感知的颜色差异（ΔE 值）。
色域最广：包含 RGB 和 CMYK 无法表示的颜色（如某些鲜艳的青色）

✅ 总结对比表

模型	构成	应用领域	优点
RGB	R, G, B	显示设备，原始图像输入	硬件友好，处理简单
HSI	Hue, Sat, Int	图像识别、分析	直观反映人类感知
HSV/HSB	Hue, Sat, Value	图像编辑、调色板	易于调色，图形用户界面常用
YCrCb	Y, Cr, Cb	视频压缩、传输	分离亮度和色度，便于压缩
Lab	L, a, b	图像增强、颜色差异检测	感知均匀、设备无关