C/C++的OpenCV 进行图像梯度提取

news2025/5/24 8:45:03

使用 C++/OpenCV 进行图像梯度提取

图像梯度表示图像中像素强度的变化率和方向。它是图像分析中的一个基本概念,广泛应用于边缘检测、特征提取和物体识别等任务。OpenCV 提供了多种计算图像梯度的函数。本文将介绍几种常用的梯度算子及其在 C++/OpenCV 中的实现。

预备知识

在开始之前,请确保您已经安装了 OpenCV,并且您的 C++ 开发环境已经配置好可以链接 OpenCV 库。

通常,我们需要包含以下头文件:

#include <opencv2/opencv.hpp> // 包含所有核心和contrib模块
#include <iostream>

为方便起见,我们也会使用 cv 命名空间:

using namespace cv;
using namespace std;

1. 图像加载与预处理

梯度计算通常在灰度图像上进行,因为颜色信息对于梯度方向的确定可能会引入不必要的复杂性。

int main(int argc, char** argv) {
    // 1. 加载图像
    // const char* filename = argc >= 2 ? argv[1] : "lena.jpg"; // 从命令行参数或默认读取
    Mat src = imread("your_image.jpg", IMREAD_COLOR); // 请替换为您的图片路径
    if (src.empty()) {
        cout << "无法加载图像: " << "your_image.jpg" << endl;
        return -1;
    }

    // 2. 转换为灰度图
    Mat gray;
    cvtColor(src, gray, COLOR_BGR2GRAY);

    // 3. (可选)高斯模糊以减少噪声,从而获得更清晰的梯度
    Mat blurred_gray;
    GaussianBlur(gray, blurred_gray, Size(3, 3), 0, 0, BORDER_DEFAULT);

    // 接下来我们将对 blurred_gray 或 gray 进行操作

2. Sobel 算子

Sobel 算子是一种离散的一阶微分算子,用于计算图像亮度函数梯度的近似值。它结合了高斯平滑和微分求导。Sobel 算子分别计算水平方向(Gx)和垂直方向(Gy)的梯度。

cv::Sobel 函数原型:

void Sobel( InputArray src, OutputArray dst, int ddepth,
            int dx, int dy, int ksize = 3,
            double scale = 1, double delta = 0,
            int borderType = BORDER_DEFAULT );
  • src: 输入图像。
  • dst: 输出图像,与输入图像大小和通道数相同。
  • ddepth: 输出图像的深度。由于梯度值可能为负,通常使用 CV_16SCV_32F 以避免信息丢失。然后通过 cv::convertScaleAbs 转换为 CV_8U 进行显示。
  • dx: x 方向上的差分阶数 (0 或 1)。
  • dy: y 方向上的差分阶数 (0 或 1)。
  • ksize: Sobel 核的大小,必须是 1, 3, 5 或 7。
  • scale: 可选的计算出的导数值的缩放因子。
  • delta: 可选的增量,在将结果存储到 dst 之前添加到结果中。
  • borderType: 像素外插方法。

计算 X 和 Y 方向的梯度

    // ... 接上文 blurred_gray

    Mat grad_x, grad_y;
    Mat abs_grad_x, abs_grad_y;

    // 计算 X 方向梯度
    // ddepth = CV_16S เพื่อหลีกเลี่ยงการตัดค่า (overflow)
    Sobel(blurred_gray, grad_x, CV_16S, 1, 0, 3, 1, 0, BORDER_DEFAULT);
    convertScaleAbs(grad_x, abs_grad_x); // 转换回 CV_8U 并取绝对值

    // 计算 Y 方向梯度
    Sobel(blurred_gray, grad_y, CV_16S, 0, 1, 3, 1, 0, BORDER_DEFAULT);
    convertScaleAbs(grad_y, abs_grad_y);

    // 显示 X 和 Y 方向的梯度
    imshow("Sobel X Gradient", abs_grad_x);
    imshow("Sobel Y Gradient", abs_grad_y);

合并梯度

通常,我们将 X 和 Y 方向的梯度组合起来得到总的梯度幅值。一个常见的方法是使用 cv::addWeighted

G = α ⋅ ∣ G x ∣ + β ⋅ ∣ G y ∣ + γ G = \alpha \cdot |G_x| + \beta \cdot |G_y| + \gamma G=αGx+βGy+γ

或者直接计算幅值 G = G x 2 + G y 2 G = \sqrt{G_x^2 + G_y^2} G=Gx2+Gy2 cv::addWeighted 提供了一种近似方法。

    Mat grad_combined;
    // 近似梯度幅值 (权重可以调整,这里简单相加)
    addWeighted(abs_grad_x, 0.5, abs_grad_y, 0.5, 0, grad_combined);
    imshow("Sobel Combined Gradient", grad_combined);

更精确的幅值计算通常需要 grad_xgrad_yCV_32F 类型,然后使用 cv::magnitude

    Mat grad_x_f, grad_y_f;
    Sobel(blurred_gray, grad_x_f, CV_32F, 1, 0, 3);
    Sobel(blurred_gray, grad_y_f, CV_32F, 0, 1, 3);

    Mat magnitude, angle;
    cartToPolar(grad_x_f, grad_y_f, magnitude, angle, true); // angle in degrees
    
    Mat abs_magnitude;
    convertScaleAbs(magnitude, abs_magnitude);
    imshow("Sobel Magnitude Precise", abs_magnitude);

3. Scharr 算子

Scharr 算子是对 Sobel 算子在核大小为 3x3 时的一种优化。它具有更好的旋转对称性,因此在某些情况下可以提供比 3x3 Sobel 算子更准确的结果。

cv::Scharr 函数原型与 cv::Sobel 类似,但它没有 ksize 参数,因为 Scharr 算子总是使用固定的 3x3 核。当 dx=1, dy=0dx=0, dy=1 时使用。

void Scharr( InputArray src, OutputArray dst, int ddepth,
             int dx, int dy, double scale = 1, double delta = 0,
             int borderType = BORDER_DEFAULT );

使用方法与 Sobel 类似:

    // ... 接上文 blurred_gray

    Mat scharr_grad_x, scharr_grad_y;
    Mat abs_scharr_grad_x, abs_scharr_grad_y;

    // 计算 X 方向 Scharr 梯度
    Scharr(blurred_gray, scharr_grad_x, CV_16S, 1, 0, 1, 0, BORDER_DEFAULT);
    convertScaleAbs(scharr_grad_x, abs_scharr_grad_x);

    // 计算 Y 方向 Scharr 梯度
    Scharr(blurred_gray, scharr_grad_y, CV_16S, 0, 1, 1, 0, BORDER_DEFAULT);
    convertScaleAbs(scharr_grad_y, abs_scharr_grad_y);

    // 显示 Scharr 梯度
    imshow("Scharr X Gradient", abs_scharr_grad_x);
    imshow("Scharr Y Gradient", abs_scharr_grad_y);

    Mat scharr_grad_combined;
    addWeighted(abs_scharr_grad_x, 0.5, abs_scharr_grad_y, 0.5, 0, scharr_grad_combined);
    imshow("Scharr Combined Gradient", scharr_grad_combined);

4. Laplacian 算子

Laplacian (拉普拉斯) 算子是一种二阶微分算子,它计算图像的二阶导数。它可以用来检测边缘,对噪声比较敏感。Laplacian 算子通常通过检测图像中的零交叉点来定位边缘。

cv::Laplacian 函数原型:

void Laplacian( InputArray src, OutputArray dst, int ddepth,
                int ksize = 1, double scale = 1, double delta = 0,
                int borderType = BORDER_DEFAULT );
  • ksize: 拉普拉斯核的大小,必须是正奇数。通常是 1 或 3。
    // ... 接上文 blurred_gray

    Mat laplacian_dst;
    Mat abs_laplacian_dst;

    Laplacian(blurred_gray, laplacian_dst, CV_16S, 3, 1, 0, BORDER_DEFAULT); // ksize=3
    convertScaleAbs(laplacian_dst, abs_laplacian_dst);

    imshow("Laplacian Operator", abs_laplacian_dst);

由于拉普拉斯算子是二阶导数,它的结果中正值和负值都有意义(表示亮度的快速变化)。convertScaleAbs 将这些值转换为适合显示的 8 位无符号整数。

5. 显示结果与程序结束

main 函数的末尾,添加等待按键和关闭窗口的调用:

    // ... 所有 imshow 调用之后
    cout << "按任意键退出..." << endl;
    waitKey(0);
    destroyAllWindows();
    return 0;
}

完整示例代码

#include <opencv2/opencv.hpp>
#include <iostream>

using namespace cv;
using namespace std;

int main(int argc, char** argv) {
    // 1. 加载图像
    const char* filename = "your_image.jpg"; // 请替换为您的图片路径
    Mat src = imread(filename, IMREAD_COLOR);
    if (src.empty()) {
        cout << "无法加载图像: " << filename << endl;
        return -1;
    }
    imshow("Original Image", src);

    // 2. 转换为灰度图
    Mat gray;
    cvtColor(src, gray, COLOR_BGR2GRAY);
    imshow("Grayscale Image", gray);

    // 3. (可选)高斯模糊以减少噪声
    Mat blurred_gray;
    GaussianBlur(gray, blurred_gray, Size(3, 3), 0, 0, BORDER_DEFAULT);
    imshow("Blurred Grayscale", blurred_gray);

    // --- Sobel 梯度 ---
    Mat grad_x_sobel, grad_y_sobel;
    Mat abs_grad_x_sobel, abs_grad_y_sobel;
    Mat grad_combined_sobel;

    Sobel(blurred_gray, grad_x_sobel, CV_16S, 1, 0, 3, 1, 0, BORDER_DEFAULT);
    convertScaleAbs(grad_x_sobel, abs_grad_x_sobel);

    Sobel(blurred_gray, grad_y_sobel, CV_16S, 0, 1, 3, 1, 0, BORDER_DEFAULT);
    convertScaleAbs(grad_y_sobel, abs_grad_y_sobel);

    addWeighted(abs_grad_x_sobel, 0.5, abs_grad_y_sobel, 0.5, 0, grad_combined_sobel);

    imshow("Sobel X Gradient", abs_grad_x_sobel);
    imshow("Sobel Y Gradient", abs_grad_y_sobel);
    imshow("Sobel Combined Gradient", grad_combined_sobel);
    
    // --- Scharr 梯度 ---
    Mat grad_x_scharr, grad_y_scharr;
    Mat abs_grad_x_scharr, abs_grad_y_scharr;
    Mat grad_combined_scharr;

    Scharr(blurred_gray, grad_x_scharr, CV_16S, 1, 0, 1, 0, BORDER_DEFAULT);
    convertScaleAbs(grad_x_scharr, abs_grad_x_scharr);

    Scharr(blurred_gray, grad_y_scharr, CV_16S, 0, 1, 1, 0, BORDER_DEFAULT);
    convertScaleAbs(grad_y_scharr, abs_grad_y_scharr);
    
    addWeighted(abs_grad_x_scharr, 0.5, abs_grad_y_scharr, 0.5, 0, grad_combined_scharr);

    imshow("Scharr X Gradient", abs_grad_x_scharr);
    imshow("Scharr Y Gradient", abs_grad_y_scharr);
    imshow("Scharr Combined Gradient", grad_combined_scharr);

    // --- Laplacian 梯度 ---
    Mat laplacian_dst;
    Mat abs_laplacian_dst;

    Laplacian(blurred_gray, laplacian_dst, CV_16S, 3, 1, 0, BORDER_DEFAULT);
    convertScaleAbs(laplacian_dst, abs_laplacian_dst);
    imshow("Laplacian Operator", abs_laplacian_dst);

    cout << "按任意键退出..." << endl;
    waitKey(0);
    destroyAllWindows();

    return 0;
}

编译与运行

假设您已正确安装 OpenCV,可以使用 g++ 编译上述代码:

g++ your_code_file.cpp -o gradient_extraction $(pkg-config --cflags --libs opencv4)
./gradient_extraction your_image.jpg

(如果 pkg-config --libs opencv4 不起作用,请根据您的 OpenCV 版本和安装方式调整链接器标志,例如 opencv 或特定模块如 opencv_core opencv_imgproc opencv_highgui opencv_imgcodecs)

总结

图像梯度是图像处理中的重要工具。Sobel、Scharr 和 Laplacian 算子是 OpenCV 中用于计算梯度的常用方法。

  • Sobel 是最常用的,提供 x 和 y 方向的梯度。
  • Scharr 在 3x3 核上通常比 Sobel 更精确。
  • Laplacian 是二阶导数,对噪声敏感,但可以直接给出边缘信息。

选择哪种算子取决于具体的应用需求和图像特性。通常,在计算梯度之前进行高斯模糊可以帮助减少噪声对结果的影响。同时,注意输出图像深度 (ddepth) 的选择,以避免梯度计算过程中的信息丢失,后续再通过 convertScaleAbs 转换到适合显示的 CV_8U 格式。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2384479.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Java高阶面经:消息队列篇】22、消息队列核心应用:高并发场景下的解耦、异步与削峰

一、消息队列:分布式系统的核心枢纽 在分布式架构日益普及的今天,消息队列(Message Queue, MQ)已成为解决系统复杂性的核心组件。它通过异步通信、系统解耦和流量控制等能力,有效应对高并发场景下的数据流动挑战。 1.1 核心特性:异步、解耦与弹性 1.1.1 异步通信:释放…

软媒魔方——一款集合多种系统辅助组件的软件

停更4年&#xff0c;但依旧吊炸天&#xff01; 亲们&#xff0c;是不是觉得电脑用久了就像老牛拉车&#xff0c;慢得让人着急&#xff1f;别急&#xff0c;我今天要给大家安利一个超好用的电脑优化神器——软媒魔方&#xff01; 软件介绍 首先&#xff0c;这货真心是免费的&a…

多路径可靠传输协议(比如 MPTCP)为什么低效

可靠就不能多路径&#xff0c;多路径求可靠必然要多费劲。这不难理解&#xff0c;多路径必异步&#xff0c;这无疑增加了可靠性判断的难度。 前文 多路径传输(比如 MPTCP)对性能的意义 阐述了作为单连接的多子流 MPTCP 对传输性能的意义是无意义&#xff0c;本文接着阐述作为隧…

塔能高温冰蓄冷技术:工厂能耗精准节能的创新之路

在工厂的能耗构成中&#xff0c;制冷系统是重要的耗能环节。传统的水蓄冷和冰蓄冷技术在实际应用中存在一些局限性&#xff0c;难以满足工厂对节能和成本控制的更高要求。塔能科技的高温冰蓄冷技术&#xff0c;凭借其独特的优势&#xff0c;为工厂能耗精准节能提供了创新的解决…

内存优化笔记1

欢迎关注更多精彩 关注我&#xff0c;学习常用算法与数据结构&#xff0c;一题多解&#xff0c;降维打击。 问题提出 在很多工业软件中&#xff0c;需要对对象进行微分细化&#xff0c;这样会产生很多&#xff08;几百万到几千万&#xff09;对象。随着业务的发展&#xff0c…

人脸识别,使用 deepface + api + flask, 改写 + 调试

1. 起因&#xff0c; 目的&#xff0c; 感受: github deepface 这个项目写的很好&#xff0c; 继续研究使用这个项目&#xff0c;改写 api。增加一个前端 flask app 2. 先看效果 3. 过程: 大力改写原始项目中 api 这部分的代码&#xff0c; 原始项目的文件结构太繁杂了: 我把…

代码管理平台Gitlab如何通过快解析实现远程访问?

一、Gitlab功能介绍 Gitlab是被广泛使用的基于git的开源代码管理平台&#xff0c;用于管理、存储开发人员代码&#xff0c;同时可以协同开发 二、外网试用Gitlab遇到的问题 运维人员将Gitlab服务器部署在总部机房&#xff0c;而分公司开发人员和出差运维人员就无法访问Gitlab…

基于SpringBoot+Vue的足球青训俱乐部管理后台系统的设计与开发

项目背景与概述 随着足球青训行业的快速发展&#xff0c;如何高效、规范地管理学员、教练以及课程等日常工作&#xff0c;成为了青训俱乐部运营的重要课题。为了提升俱乐部的管理效率与用户体验&#xff0c;基于 Spring Boot 和 Vue.js 开发了一个 足球青训俱乐部管理后台系统…

线程调度与单例模式:wait、notify与懒汉模式解析

一.wait 和 notify&#xff08;等待 和 通知&#xff09; 引入 wait notify 就是为了能够从应用层面&#xff0c;干预到多个不同线程代码的执行顺序&#xff0c;可以让后执行的线程主动放弃被调度的机会&#xff0c;等先执行的线程完成后通知放弃调度的线程重新执行。 自助取…

MySQL中TCP和套接字SSL加密连接行为分析

目录 一、前言 二、背景 三、参数介绍 3.1、 have_openssl 3.2、have_ssl 3.3、require_secure_transport 四、--ssl-modemode 五、CREATE USER SSL/TLS选项 六、问题验证 6.1、使用套接字连接 6.2、使用TCP连接 七、分析与总结 一、前言 SSL&#xff08;Secure S…

php本地 curl 请求证书问题解决

错误: cURL error 60: SSL certificate problem: unable to get local issuer certificate (see https://curl.haxx.se/libcurl/c/libcurl-errors.html) for 解决方案 在php目录下创建证书文件夹, 执行下面生成命令, 然后在php.ini 文件中配置证书路径; 重启环境 curl --eta…

爱普生晶振赋能UWB汽车数字钥匙,解锁未来出行新方式

随着科技的发展&#xff0c;尤其是国产新能源汽车的崛起&#xff0c;相信大家对数字钥匙的概念已经不陌生了&#xff0c;通过手机、智能穿戴实现对汽车的多功能控制已经是很多汽车的标配。但是目前数字钥匙也有一定的局限性&#xff0c;比如定位不准、安全性不强等等&#xff0…

电子电路:深入理解电磁耦合的定义与应用

电场和磁场是独立存在的吗&#xff1f;&#xff0c;但实际上根据麦克斯韦理论&#xff0c;它们是同一现象的两个方面&#xff0c;通过变化相互产生。这时候需要强调时变场的重要性&#xff0c;以及静态场和动态场的区别。 通过电磁波的概念&#xff0c;说明电磁耦合如何导致电…

宝塔安装的 MySQL 无法连接的情况及解决方案

宝塔安装的 MySQL 无法连接的情况及解决方案 宝塔面板是一款流行的服务器管理工具&#xff0c;其中集成的 MySQL 数据库有时会出现连接问题。本文详细介绍两种最常见的 MySQL 连接错误&#xff1a;“1130 - Host is not allowed to connect” 和 “1045 - Access denied”&…

今日行情明日机会——20250523

上证指数缩量下跌&#xff0c;个股下跌超过4000个&#xff0c;总体跌多涨少&#xff0c;日线总体处于高位&#xff0c;注意风险。 深证60分钟级别下跌趋势线压制&#xff0c;总体日线转下跌的概率大&#xff0c;注意风险。 2025年5月23日涨停股主要行业方向分析 一、核心主…

微服务项目->在线oj系统(Java版 - 4)

相信自己,终会成功 目录 B端用户管理 C端用户代码 发送验证码: 验证验证码 退出登录 登录用户信息功能 用户详情与用户编辑 用户竞赛接口 用户报名竞赛 用户竞赛报名接口查询 用户信息列表 ThreadLocalUtil Hutool工具库 常用功能介绍 B端用户管理 进行列表显示与…

ReAct 与 CoAct:AI 代理的推理与行动之旅

引言 能推理又能行动的 AI 代理&#xff0c;是朝着构建更自主系统迈出的重要一步。传统上&#xff0c;语言模型在“思维链”提示方面表现得很出色&#xff0c;也就是通过文本逐步思考问题来解决像算术、常识问题或符号推理这类任务。但用思维链时&#xff0c;模型只依赖自身的…

uni-app使用大集

1、手动修改页面标题 uni.setNavigationBarTitle({title: 修改标题 }); 2、单选 不止有 radio-group&#xff0c;还有 uni-data-checkbox 数据选择器 <!-- html部分 --> <uni-data-checkbox v-model"sex" :localdata"checkboxList"></u…

零件剖切配置教学 | 玩转EasyTwin 工业产线第三期(上)课程回顾

-在工业数字孪生领域&#xff0c;工程施工模拟、车间产线运转、机械装置和零件配置等交互效果的呈现至关重要。通过EasyTwin&#xff0c;我们能够以更低成本、更高效率来构建数字孪生场景&#xff0c;但在搭建的过程中&#xff0c;也会因为复杂的场景交互配置产生一些疑问。该案…

onnx模型转入rknn3399平台上工作记录

1.rknn虚拟环境使用时报错问题 使用rknn17环境的报错&#xff1a; ImportError: libdc1394.so.22: cannot open shared object file: No such file or directory 参考链接&#xff1a;https://blog.csdn.net/2301_80032564/article/details/142316410 创作软连接&#xff1a; …