每个像素 7 个 FLOPs意思:
- FLOPs(浮点运算次数):衡量算法计算复杂度的指标,数值越小表示运算越高效。
- 含义:对图像中每个像素进行处理时,仅需执行7 次浮点运算(如加减乘除等)。
一、核心概念:域变换(Domain Transform)
定义:
域变换(Domain Transform)就是把数据从“原始的形式”转到“更容易分析或处理的形式”。就像你把一张复杂的地图变成一张简化图,方便找方向。 在图像处理中,我们就是把图像从“像素空间”变到“更有意义的数学空间”,比如边缘空间、频率空间、多尺度空间等。
二、典型域变换技术解析
1. 主成分分析(PCA, Principal Component Analysis)
作用:把高维数据“压缩”到低维,同时尽量保留原来的主要信息。
类比:就像你拍一张照片时,只保留最清晰的部分,模糊掉不重要的背景。
应用:人脸识别(提取特征脸)、数据可视化、噪声过滤。
示例:将 1000 维图像特征压缩到 50 维,保留 95% 的信息。
2. 拉普拉斯金字塔(Laplacian Pyramid)
做什么?把图像分解成多个“层”,分别代表不同清晰度的图像细节(高频)和模糊背景(低频)。
类比:想象你逐层模糊一张照片,然后每层都保存“这层比上一层多出的细节”。
用途:图像融合(如将不同曝光的图像合成一张漂亮的照片)
例子:把多张不同曝光的照片融合成一张完美的全景图时使用。
3. 小波变换(Wavelet Transform)
做什么?把图像分解成不同频率、不同时间(空间)位置的信息。
本质:在不同尺度(zoom in/zoom out)下观察信号或图像的“局部细节”。
4. 轮廓波变换(Contourlet Transform)
做什么?像小波变换一样分解图像,但更擅长表示线条、曲线等结构性信息。
类比:比小波更像“画笔”,能清晰地画出道路、轮廓。
用途:
遥感图像分析(如识别地图上的河流、道路)
纹理合成与重建
5. 多分辨率奇异值分解(MR-SVD)
6. 潜在低秩表示(LRR, Low-Rank Representation)
做什么? 假设一个图像或视频是由两部分构成:
主要结构(低秩)
干扰、异常、噪声(稀疏)
类比:一段监控视频,大部分时间背景是静止的(低秩),只有行人或车在动(稀疏)。
用途:背景建模(把视频中的背景和前景分离);遮挡下的人脸识别