第一章 概述
1.1 什么是数字图像?
图像分为两大类:模拟图像与数字图像
- 模拟图像:通过某种物理(光、电)的强弱变化来记录图像上各个点的亮度信息
连续:从空间上和数值上是不间断的
举例:胶卷照片、纸质照片、肉眼看见的图像
- 数字图像:模拟图像经过采样和量化后得到的图像
数字化意味着数字图像只是真实图像的近似,在数字化过程有信息损失(是为了方便计算机处理才做的采样和量化)
举例:数码相机储存的图像
像素值通常表示灰度、颜色、不透明度等
图像的采样和量化是数字图像处理的两个基本步骤,主要用于将模拟图像(如自然世界中的连续图像)转换为数字图像(即计算机可处理的图像)
一、采样(Sampling)
定义:
采样是指在图像的空间域中对连续图像进行空间上的离散化,也就是在图像中选取一些特定的位置(点)来代表整个图像。
通俗理解:
就像你拿相机拍照,感光元件上每个像素点都在采集一个位置的信息,最终得到一张由很多像素点组成的图像。举例说明:
一幅图像的分辨率是 1920×1080,这表示图像在水平方向被采样了1920次,垂直方向采样了1080次。
如果采样率低,图像就会显得模糊、马赛克严重。
二、量化(Quantization)
定义:
量化是指将每个采样点的像素值(通常是灰度值或颜色值)从连续的模拟值转化为有限的离散数值等级。通俗理解:
现实世界中的亮度、颜色变化是连续的,但计算机只能表示有限数量的数字。因此必须把这些连续值四舍五入到最近的离散值。举例说明:
灰度图像中,如果使用8位来表示灰度值,就有 2^8 = 256个灰度等级。
如果量化等级太少(如只用2位=4个灰度级),图像就会出现色带(伪影),失去细节。
三、采样 vs 量化 对比
项目 采样 量化 涉及的维度 空间维度(横纵坐标) 灰度或颜色值 作用 选取图像中的像素点 将每个像素值转化为整数级别 结果 影响图像的分辨率 影响图像的灰度层次或色彩精度 拍照时,“你拍了多少个点”是采样,“你对每个点的颜色记录得有多精细”是量化。
1.2数字图像处理的基本流程
-
图像获取
通过传感器(如相机、扫描仪、MRI设备)将现实世界的模拟图像转换为数字信号(采样+量化)。 -
预处理
增强:调整对比度、降噪、锐化(如直方图均衡化、滤波)。 校正:消除几何畸变、色彩偏差(如镜头畸变修正)。 -
特征提取
检测边缘、纹理、形状或特定目标(如SIFT特征、霍夫变换)。 -
分析与识别
分类(如人脸识别)、分割(如医学图像中的肿瘤区域)、测量(如细胞计数)。 -
输出与可视化
生成处理后的图像、数据报告或控制指令(如自动驾驶中的障碍物标记)。
1.3 数字图像处理的发展趋势
Ø 从低分辨率向高分辨率发展
Ø 从二维(2D)向三维(3D)发展
Ø 从静止图像向动态图像发展
Ø 从单态图像向多态图像发展
Ø 从图像处理向图像理解发展
第二章 基础知识
2.1 图像的数字化
- 采样 →M*N矩阵
- 量化→连续函数f(x,y)被划分为K个空间
- 采样及量化越精细(M,N,K越大),越逼近连续图像

2.2 图像的表示
2.3 图像模式及彩色模型
图像模式:
二值图像:指图像中的每个像素点只有 两种可能的取值(通常为 0 和 1),分别对应 黑色 和 白色(或其他两种颜色的组合)。
灰度图像:灰度图像中每个像素点的取值表示 亮度(明暗程度),通常范围为 0(黑色)到 255(白色),共 256 级灰度(8 位二进制数。 灰度图像可以保留亮度信息:能体现图像的明暗层次,但不包含颜色信息。
彩色图像:彩色图像通过不同颜色通道的组合来表示像素的颜色。每个像素通常占用 3 字节(RGB 三通道各 1 字节),存储和处理成本较高。
常用的彩色模型:
彩色模型(颜色空间)用于以数学方式描述颜色。
1. RGB(Red, Green, Blue)
-
原理:基于光的三原色叠加(加色模型)。
-
表示:
-
三维坐标
(R, G, B)
,每通道范围通常为0~255
(8位)。 -
黑色:
(0, 0, 0)
;白色:(255, 255, 255)
。、
-
-
特点:
-
直接对应显示器/传感器的物理输出。
-
颜色与亮度耦合,调整单一通道会影响亮度和色相。
- 等比例混合时(如 R=G=B)呈现灰度色(如 R=G=B=128 为灰色)。
-
2.HSI 彩色模型(Hue-Saturation-Intensity)
原理
- 基于人类视觉感知:将颜色分解为三个直观的分量:
- 色调(Hue, H):颜色的种类(如红、绿、蓝),取值范围通常为 0°-360°(对应色轮圆周)。
- 饱和度(Saturation, S):颜色的纯度(鲜艳程度),取值范围 0%-100%(0% 为灰度色,100% 为纯色)。
- 亮度(Intensity, I):颜色的明暗程度,取值范围 0%-100%(0% 为黑色,100% 为白色)。
亮度定义 三通道平均值(Intensity,平均亮度)
特点
- 解耦颜色属性:H、S、I 三个分量相互独立,便于单独调整(如调节亮度不影响色调)。
- 与 RGB 可相互转换:通过数学公式实现转换,但计算复杂度较高。
3.HSV 彩色模型(Hue-Saturation-Value)
-
RGB:基于光的三原色叠加,适用于显示器存储。
-
HSV:基于人眼感知,分离色相(H)、饱和度(S)、明度(V),更适合颜色调整和图像分析。
原理
- 类似 HSI 的变体:
- 色调(H):与 HSI 的 H 含义相同(0°-360°)。
- 饱和度(S):与 HSI 的 S 含义相同(0%-100%)。
- 明度(Value, V):对应颜色的 最大亮度(与 HSI 的亮度 I 略有差异),取值范围 0%-100%(0% 为黑色,100% 为纯色最亮状态)
亮度定义 | 三通道最大值(Value,最大亮度 |
4.YCrCb(Luminance-Chrominance)
-
原理:分离亮度(Y)和色度(Cr, Cb),基于人眼对亮度更敏感的特性。
-
表示:
-
Y:亮度(类似灰度)。
-
Cr:红色分量与亮度的差值。
-
Cb:蓝色分量与亮度的差值。
-
-
特点:
-
色度信息可压缩(如JPEG压缩时降低Cr/Cb分辨率)。
-
兼容黑白显示(仅需Y通道)
-
5.Lab 彩色模型(CIE L*a*b*)
原理
- 设备无关的感知模型:由国际照明委员会(CIE)定义,基于人类视觉的 均匀颜色空间,理论上能覆盖人眼可见的所有颜色。
- 三个分量:
- L(亮度):取值范围 0-100(0 为黑色,100 为白色)。
- a(红绿轴):取值范围 -128-127(负值为绿色,正值为红色)。
- b(蓝黄轴):取值范围 -128-127(负值为蓝色,正值为黄色)。
特点
- 最接近人类视觉:颜色空间均匀分布,任意两点间的欧氏距离对应人眼感知的颜色差异(ΔE 值)。
- 色域最广:包含 RGB 和 CMYK 无法表示的颜色(如某些鲜艳的青色)
✅ 总结对比表
模型 | 构成 | 应用领域 | 优点 |
---|---|---|---|
RGB | R, G, B | 显示设备,原始图像输入 | 硬件友好,处理简单 |
HSI | Hue, Sat, Int | 图像识别、分析 | 直观反映人类感知 |
HSV/HSB | Hue, Sat, Value | 图像编辑、调色板 | 易于调色,图形用户界面常用 |
YCrCb | Y, Cr, Cb | 视频压缩、传输 | 分离亮度和色度,便于压缩 |
Lab | L, a, b | 图像增强、颜色差异检测 | 感知均匀、设备无关 |