图像处理与图像分析—图像的读入(C语言)

news2025/6/7 2:45:18

学习将会依据教材图像处理与图像分析基础(C/C++)版内容展开


什么是数字图像处理

一副图像可以定义为一个二维函数 f(x,y) ,其中 x 和 y 是空间(平面)坐标,任意一对空间坐标 (x,y) 处的幅度值 (x,y) 称为图像在该坐标点的强度或灰度。当 x,y 和灰度值 f 都是有限的离散量时,我们称该图像为数字图像。数字图像处理是指借助于数字计算机来处理数字图像。注意,数字图像由有限数量的元素组成,每个元素都有一定的位置和数值,这些元素称为像素

好,那么图像数字处理的第一步是什么?

一定是对于单个图片的读取,今天的主要目标也是读取一整个图片的完整信息

所用的语言为C语言,更加底层,能够帮助我们更好的理解

C语言编译器主要有Clang、GCC、WIN-TC、SUBLIME、MSVC、Turbo C等。

但是这里我说一下,我之前在编写C语言代码是所使用的都是GCC编译器,但是这一遍学习准备尝试一下MSVC这样一个微软的编译器,同时开始尝试使用VS2022来进行开发,之前使用Clion进行开发


我们先来看书上的【程序2-1】点运算的经典程序结构
void F1(BYTE* pimg, int width, int height)
{
	BYTE* pCur, * pEnd;

	pEnd = pImg + width * height;
	for (pCur = pImg; pCur < pEnd)
	{
		*(pCur++) = f(*pCur);
	}
	return;
}

我先来分析一下这个代码:

//首先这串代码是一个名为F1的函数,输入参数是一个BYTE类型的指针变量,整型的宽度和高度
void F1(BYTE* pimg, int width, int height)
{
	BYTE* pCur, * pEnd;
    //定义了两个指针变量* pCur, * pEnd
	pEnd = pImg + width * height;
    //表示将指针 pEnd 设置为指向图像数据末尾的位置。这里的计算方式是将指针 pImg 指向的内存地址加上图像的宽度乘以高度,从而得到图像数据的最后一个像素的下一个位置。
    
    
	for (pCur = pImg; pCur < pEnd)
    //pCur = pImg;:首先将指针变量 pCur 初始化为指向图像数据的起始位置,即指针 pImg 所指向的位置。
    //pCur < pEnd:这是循环的终止条件。只要 pCur 指针小于 pEnd 指针(即还未到达图像数据的末尾),就会继续执行循环。
	{
		*(pCur++) = f(*pCur);
        //首先会调用函数 f,并将当前指针 pCur 所指向的像素值作为参数传递给函数 f。函数 f 对该像素值进行处理,并返回处理后的结果。然后,将这个处理后的结果写回到当前指针 pCur 所指向的位置,并通过 pCur++ 操作使指针指向下一个像素位置。
	}
	return;
}

因为咱们用的是C语言哈,我写这些代码的时候已经发现报错了

原因是啥? —— C语言里面没有BYTE类型,所以只能用别的类型替代,BYTE我去查了一下,人如其名,一个字节的存储空间,那我这里就用uint8_t来代替这个指针类型

那C语言版本就呼之欲出了

void F1(uint8_t* pImg, int width, int height)
{
    uint8_t* pCur;
    uint8_t* pEnd;

    pEnd = pImg + width * height;
    for (pCur = pImg; pCur < pEnd; pCur++)
    {
        *pCur = f(*pCur);
    }
    return;
}

其实uint8_t变量还是报错了,是因为没有引用头文件,引用#include <stdint.h>就完美解决

那接下来的问题,f函数是什么?—我们先来看下一个例子,再来探讨这个问题


【程序2-2】邻域运算的典型程序结构

void F2(BYTE* pOrgImg, int width, int height, BYTE* pResImg)
{
	BYTE* pCur, * pRes;
	int x, y;
	for (y = 0, pCur = pOrgImg, pRes = pResImg; y < height; y++)
	{
		for (x = 0; x < width; x++, pCur++, pRes++)
		{
			*pRes = f(pOrgImg, x, y);
		}
	}
	return;
}

我们还是先看一下这个cpp代码,先根据我的理解注释一下

//四个传入值,指针为BYTE型
//pOrgImg:这是指向原始图像数据的指针。原始图像数据包含了待处理的像素值。
//width:这是图像的宽度,表示图像的水平像素数。
//height:这是图像的高度,表示图像的垂直像素数。
//pResImg:这是指向结果图像数据的指针。结果图像数据将存储经过处理后的像素值。
void F2(BYTE* pOrgImg, int width, int height, BYTE* pResImg)
{
	BYTE* pCur, * pRes;
    //创建两个指针,通过指针 pCur 和 pRes 分别指向原始图像和结果图像中当前位置的像素。
	int x, y;
    
  
	for (y = 0, pCur = pOrgImg, pRes = pResImg; y < height; y++)
    //y = 0,从顶部开始处理,原始图像指针指向原始图像开始的位置,结果图像指针只想结果图像开始的部分
    //y一直递增,直到便利完所有的行数
	{
		for (x = 0; x < width; x++, pCur++, pRes++)
		{
            //x循环来保证遍历完每一行的所有像素块
            //并且,每次原始图像指针和结果图像指针都往后递增来访问正确的操作像素
			*pRes = f(pOrgImg, x, y);
            //调用函数 f,并将原始图像数据指针 pOrgImg、当前位置的水平坐标 x 和垂直坐标 y 作为参数传递给 f 函数。f 函数会对该像素进行处理,并返回处理后的结果。
		}
	}
	return;
}

C语言版本顺手写一下

void F2(uint8_t* pOrgImg, int width, int height, uint8_t* pResImg)
{
    uint8_t* pCur;
    uint8_t* pRes;
    int x, y;

    for (y = 0, pCur = pOrgImg, pRes = pResImg; y < height; y++)
    {
        for (x = 0; x < width; x++, pCur++, pRes++)
        {
            *pRes = f(pOrgImg, x, y);
        }
    }
    return;
}

没有报错!


分析F1和F2

函数 F1
  • 参数
    • 接收三个参数:图像数据指针 pImg、图像宽度 width 和图像高度 height
  • 功能
    • 使用一个循环遍历图像中的每个像素。
    • 对每个像素调用函数 f 进行处理,并将处理结果直接更新到原始图像数据中。
函数 F2
  • 参数
    • 接收四个参数:原始图像数据指针 pOrgImg、图像宽度 width、图像高度 height 和结果图像数据指针 pResImg
  • 功能
    • 使用两个嵌套循环遍历原始图像的每个像素。
    • 对每个像素调用函数 f 进行处理,并将处理结果存储到结果图像数据中。
区别:
  1. 循环方式:函数 F1 使用单层循环来遍历像素,而函数 F2 使用嵌套循环进行遍历。
  2. 参数传递:函数 F1 直接操作原始图像数据,而函数 F2 在处理像素时需要额外传递像素的坐标信息 xy
  3. 结果存储:函数 F1 直接在原始图像数据中更新处理结果,而函数 F2 将处理结果存储到另一个结果图像数据中,保持了原始数据的不变性。
函数f

函数 f 被用作对图像数据进行处理的函数

接受一个像素值,处理后在返回一个像素值存入


过程实现

需要读取的图片

ME

本次要求是可以读取数据,那么我们实现的话F1和F2都可以针对像素进行操作

我们这次就通过F1来实现图像的读取

想了一下F1和F2其实都是针对于像素进行编辑操作,那我们的目标就是通过F1实现对于图片数据的读取,并打印在终端

void F1(uint8_t* pImg, int width, int height)
{
    uint8_t* pCur;
    uint8_t* pEnd;

    pEnd = pImg + width * height;
    for (pCur = pImg; pCur < pEnd; pCur++)
    {
        //*pCur = f(*pCur);
        printf("%d",*pCur);
    }
    return;
}

C语言怎么去读图片呢,问了一下chatgpt

const char* filename = "path/to/your/image.jpg"; // 图片文件路径

// 打开文件
FILE* file = fopen(filename, "rb");
if (file == NULL) {
    printf("无法打开文件:%s\n", filename);
    return 1;
}

// 获取图像宽度和高度(根据图像格式进行解析)
int width = 0;  // 替换为实际的宽度值
int height = 0; // 替换为实际的高度值

// 分配内存来存储图像数据
uint8_t* imageData = (uint8_t*)malloc(width * height);
if (imageData == NULL) {
    printf("内存分配失败\n");
    fclose(file);
    return 1;
}

// 读取图像数据
size_t bytesRead = fread(imageData, 1, width * height, file);
if (bytesRead != width * height) {
    printf("读取图像数据失败\n");
    free(imageData);
    fclose(file);
    return 1;
}

可以参考一下,其中就发现了几个问题

高度和宽度又该如何去自动计算呢?

查了一下jpg格式的图片,其文件结构更为复杂,直接解析文件头部来获取图像的宽度和高度相对困难。JPEG 文件通常包含了大量的压缩数据和标记信息,因此需要专门的 JPEG 解码器来读取并解析这些数据。深度搜索后发现,可以通过开源的 JPEG 解码库来获得

有点难,咱们还是先写死程序

image-20240309175426145

原码:

#include <stdio.h>
#include <stdint.h>

void F1(uint8_t* pImg, int width, int height)
{
    uint8_t* pCur;
    uint8_t* pEnd;

    pEnd = pImg + width * height;
    for (pCur = pImg; pCur < pEnd; pCur++)
    {
        //*pCur = f(*pCur);
        printf("%d", *pCur);
    }
    return;
}

int main()
{
    const char* filename = "C:/Users/25706/Pictures/Camera Roll/ME.jpg";

    FILE* file = fopen(filename, "rb");
    if (file == NULL) {
        printf("无法打开文件:%s\n", filename);
        return 1;
    }

    int width = 1107;  //通过Windows自带的画图工具看到图片尺寸为1107
    int height = 1107; 

    uint8_t* imageData = (uint8_t*)malloc(width * height);//按需分配内存
    if (imageData == NULL) {
        printf("内存分配失败\n");
        fclose(file);
        return 1;
    }

    size_t bytesRead = fread(imageData, 1, width * height, file);
    if (bytesRead != width * height) {
        printf("读取图像数据失败\n");
        free(imageData);
        fclose(file);
        return 1;
    }

    F1(imageData, width, height);//调用F1来打印图片信息

    fclose(file);    // 关闭文件和释放内存
    free(imageData);

    return 0;
}

运行结果:

读取图像数据失败

后面又尝试了png、bmp等图片格式,全都失败了。

失败原因,图片不止这么大,bmp图片还包含别的信息

查了bmp文件格式

BMP文件由4部分组成:

  1. 位图文件头(bitmap-file header)
  2. 位图信息头(bitmap-informationheader)
  3. 颜色表(color table)
  4. 颜色点阵数据(bits data)

24位真彩色位图没有颜色表,所以只有1、2、4这三部分。

所以在 main 函数中,读取图像数据时需要考虑 BMP 图像文件头的大小(通常为 54 字节)。你需要跳过文件头,才能正确读取图像的 RGB 数据。可以通过 fseek 函数将文件指针移动到图像数据的起始位置。

重新修改

重新整理思路

第一步:打开文件

 const char* filename = "E:/code/IDP-Learning-Journey/images/ME.bmp";
//定义常变量指针变量指向文件地址

 FILE* file = fopen(filename, "rb");
//把未见打开为只读模式

第二部:处理图像数据

uint8_t bmpHeader[54];  
// 定义一个数组来存储 BMP 文件头信息,总共 54 字节
fread(bmpHeader, 1, 54, file);  
// 从文件中读取 54 字节的数据到 bmpHeader 数组中

int width = *(int*)&bmpHeader[18];   // 从偏移量为 18 的位置读取图像宽度信息,使用指针强制类型转换将字节数据转换为整型数据
int height = *(int*)&bmpHeader[22];  // 从偏移量为 22 的位置读取图像高度信息,同样使用指针强制类型转换

uint8_t* imageData = (uint8_t*)malloc(width * height);  // 根据图像宽度和高度动态分配内存,用于存储图像数据

fseek(file, 54, SEEK_SET);  
// 将文件指针移动到 54 字节的位置,跳过 BMP 文件头部分

fread(imageData, 1, width * height, file);  
// 从文件中读取图像数据,每个像素点占用 1 个字节

*(int*)&bmpHeader[18] 这个表达式的含义是:

  • &bmpHeader[18] 取得 bmpHeader 数组中第 18 个元素的地址,也就是指向宽度信息的起始位置。
  • (int*) 表示将这个地址强制转换为指向整型数据的指针。
  • * 表示解引用这个指针,获取该地址上的值,即宽度信息。

第三步:调用函数,打印信息

F1(imageData, width, height);

函数在上面讲过了,可以回去看看

void F1(uint8_t* pImg, int width, int height)
{
    uint8_t* pCur;
    uint8_t* pEnd;

    pEnd = pImg + width * height;
    for (pCur = pImg; pCur < pEnd; pCur++)
    {
        //*pCur = f(*pCur);
        printf("%d ", *pCur);  // 输出灰度值
    }
    return;
}

第四步:好程序员的良好习惯

fclose(file);
free(imageData);

return 0;

成功!!!!!!!!!!!!!!

image-20240309183813597

真的太难了,本来以为不是很难的

原码必须记录:

#include <stdio.h>
#include <stdint.h>
#include <stdlib.h>


void F1(uint8_t* pImg, int width, int height)
{
    uint8_t* pCur;
    uint8_t* pEnd;

    pEnd = pImg + width * height;
    for (pCur = pImg; pCur < pEnd; pCur++)
    {
        //*pCur = f(*pCur);
        printf("%d ", *pCur);  // 输出修改后的像素值
    }
    return;
}

int main()
{
    const char* filename = "E:/code/IDP-Learning-Journey/images/ME.bmp";

    FILE* file = fopen(filename, "rb");

    uint8_t bmpHeader[54];
    size_t bytesRead = fread(bmpHeader, 1, 54, file);

    int width = *(int*)&bmpHeader[18];   // 宽度信息位于偏移量为 18 的位置
    int height = *(int*)&bmpHeader[22];  // 高度信息位于偏移量为 22 的位置

    uint8_t* imageData = (uint8_t*)malloc(width * height); 

    fseek(file, 54, SEEK_SET);  // 跳过 BMP 文件头

    bytesRead = fread(imageData, 1, width * height, file); 

    F1(imageData, width, height);

    fclose(file);
    free(imageData);

    return 0;
}

灰度值和rgb有什么区别呢,查了一下,区别就是在读取像素点的时候所分配的字节个数

那么如果我们给图片的每个像素点分配三个字节

用F1中pCur的遍历图像数据中的每个像素点。pCur 指向当前正在处理的像素点的起始位置,通过 pCur 指针就可以逐个访问每个像素点的颜色数据。

试验了一下也是可以成功的

#define _CRT_SECURE_NO_WARNINGS 1
#include <stdio.h>
#include <stdint.h>
#include <stdlib.h>

void F1(uint8_t* pImgRGB, int width, int height)
{
    uint8_t* pCur;
    uint8_t* pEnd;

    pEnd = pImgRGB + width * height * 3;  // 每个像素点占用 3 个字节(BGR)
    for (pCur = pImgRGB; pCur < pEnd; pCur += 3) {
        uint8_t blue = pCur[0];
        uint8_t green = pCur[1];
        uint8_t red = pCur[2];
        printf("R: %d, G: %d, B: %d ", red, green, blue);
    }
}

int main()
{
    const char* filename = "E:/code/IDP-Learning-Journey/images/ME.bmp";

    FILE* file = fopen(filename, "rb");

    uint8_t bmpHeader[54];
    fread(bmpHeader, 1, 54, file);

    int width = *(int*)&bmpHeader[18];   // 宽度信息位于偏移量为 18 的位置
    int height = *(int*)&bmpHeader[22];  // 高度信息位于偏移量为 22 的位置

    uint8_t* imageData = (uint8_t*)malloc(width * height * 3);  // 每个像素点占用 3 个字节(BGR)

    fseek(file, 54, SEEK_SET);  // 跳过 BMP 文件头

    fread(imageData, 3, width * height, file);  // 每个像素点占用 3 个字节(BGR)

    F1(imageData, width, height);

    fclose(file);
    free(imageData);

    return 0;
}

image-20240309191106732


感谢您的观看!!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1504625.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

浅谈Redis和分布式系统

浅谈Redis Redis用于存储数据&#xff0c;且在内存当中进行存储。 但是在日常编写代码中&#xff0c;定义一个变量也就属于在内存当中存储一个数据。 Redis主要会在分布式系统当中发挥重要作用&#xff0c;如果只是单机程序&#xff0c;直接通过变量存储数据的方式会比使用Re…

域名交易系统已测试可正常使用免授权带后台

域名交易系统已测试可正常使用免授权带后台 下载地址&#xff1a;迅雷云盘

CSS中元素的层叠顺序

层叠顺序&#xff0c;英文称作 stacking order&#xff0c;表示元素发生层叠时有着特定的垂直显示顺序。下面是盒模型的层叠规则&#xff1a; 对于上图&#xff0c;由上到下分别是&#xff1a; &#xff08;1&#xff09;背景和边框&#xff1a;建立当前层叠上下文元素的背景…

首屏性能优化:提升用户体验的秘籍

&#x1f90d; 前端开发工程师、技术日更博主、已过CET6 &#x1f368; 阿珊和她的猫_CSDN博客专家、23年度博客之星前端领域TOP1 &#x1f560; 牛客高级专题作者、打造专栏《前端面试必备》 、《2024面试高频手撕题》 &#x1f35a; 蓝桥云课签约作者、上架课程《Vue.js 和 E…

动态规划(算法竞赛、蓝桥杯)--数位DP--Windy树

1、B站视频链接&#xff1a;E37 数位DP Windy数_哔哩哔哩_bilibili 题目链接&#xff1a;[SCOI2009] windy 数 - 洛谷 #include <bits/stdc.h> using namespace std; const int N 12; int a[N]; //把整数的每一位数字抠出来&#xff0c;存入数组 int f[N][10]; /…

Unity L屏幕实现方式(已抛弃)

效果 右侧主要的参数&#xff1a;Line参数能够调整中间线的高度&#xff0c;PointXY能够调整整个下方弯曲图像的比例。 使用的是RenderTexture填充RawImage显示的方式&#xff0c;需要将一张RenderTexture设置位摄像机的输出内容。 ShaderGraph 由于这个采用了一定的数学模型…

linux多线程编程使用互斥量的原理分析和应用实例

目录 概述 1 保护对共享变量的访问&#xff1a;互斥量 1.1 认识互斥量 1.2 互斥锁API 1.2.1 互斥锁初始化函数 1.2.2 互斥锁函数 1.2.3 互斥锁变体函数 1.3 互斥锁使用方法 1.4 互斥锁死锁 2 互斥量的应用介绍 2.1 创建与销毁 2.1.1 创建互斥量 2.1.2 销毁互斥量 …

Python图像处理:1.插值、频域变换与对比度增强

一、几何变换 7.图像的插值 (1)原理介绍 下面对比三种插值方法&#xff0c;分别是最近邻插值法、双线性插值法、卷积插值法&#xff0c;三种方法的前提和特点、优缺点、适用场景如下&#xff1a; 最近邻插值&#xff08;Nearest Neighbor Interpolation&#xff09;&#xf…

简单认识Linux

今天带大家简单认识一下Linux&#xff0c;它和我们日常用的Windows有什么不同呢&#xff1f; Linux介绍 Linux内核&发行版 Linux内核版本 内核(kernel)是系统的心脏&#xff0c;是运行程序和管理像磁盘和打印机等硬件设备的核心程序&#xff0c;它提供了一个在裸设备与…

线上应用部署了两台load为1四核服务器

线上应用部署了两台服务器。 项目发布后&#xff0c;我对线上服务器的性能进行了跟踪&#xff0c;发现一台负载为3&#xff0c;另一台负载为1&#xff0c;其中一台四核服务器已经快到瓶颈了&#xff0c;所以我们紧急排查原因。 1、使用TOP命令查看占用CPU较大的负载和进程&…

鸿蒙OpenHarmony HDF 驱动开发

目录 序一、概述二、HDF驱动框架三、驱动程序四、驱动配置坚持就有收获 序 最近忙于适配OpenHarmonyOS LiteOS-M 平台&#xff0c;已经成功实践适配平台GD32F407、STM32F407、STM32G474板卡&#xff0c;LiteOS适配已经算是有实际经验了。 但是&#xff0c;鸿蒙代码学习进度慢下…

Kotlin dist downloading failed

现象&#xff1a; 在使用AndroidStudio编写Flutter项目时总是在工具的右下角提示错误信息 该问题通常在刚刚打开AndroidStudio时报出&#xff0c;但可以正常编译和运行flutter项目即Android项目 分析&#xff1a;Flutter项目组认为这是AndroidStudio工具平台本身的问题非Flut…

AI智能应用百科立即落地实操课

该课程旨在教授学员如何将AI智能应用于实际场景。通过深入的案例研究和实操练习&#xff0c;学员将学会应用机器学习、自然语言处理等技术&#xff0c;快速解决现实问题。课程强调实际操作&#xff0c;帮助学员快速运用AI技术解决工作中的挑战。 课程大小&#xff1a;3.3G 课…

pytorch安装记录

pytorch安装记录 1 安装anconda2 安装pycharm3 安装显卡驱动4 根据显卡驱动版本下载CUDA5 cudnn安装6 根据CUDA版本安装pytorch7 pytorch卸载 1 安装anconda 下载地址: https://www.anaconda.com/download#downloads 验证是否安装成功&#xff1a;打开cmd, 输入 conda 验证环…

复盘-excel

excel-选列没有用&#xff0c;选小标题才可以 将簇状柱形图放置在一个新表上##### excel: 添加数据模型时&#xff0c;要通过套用表格格式与外部断开连接 透视分析2010年人数未解决(第四套&#xff09; 通过日期显示星期几 判断星期几 因为前面已经通过星期六&#xff0c…

贪心算法(蓝桥杯 C++ 题目 代表 注解)

介绍&#xff1a; 贪心算法&#xff08;Greedy Algorithm&#xff09;是一种在每一步选择中都采取当前状态下最好或最优&#xff08;即最有利&#xff09;的选择&#xff0c;从而希望最终能够得到全局最好或最优的结果的算法。它通常用来解决一些最优化问题&#xff0c;如最小生…

sentinel prometheus指标收集及资源规则正则表达式实现

sentinel 支持 prometheus 收集指标 实现原理 在 sentinel-extension 模块下&#xff0c;新增 sentinel-prometheus-metric-exporter 模块。依赖Prometheus 提供的 simpleclient 和 simpleclient_httpserver 来实现 exporter。 依赖 simpleclient 主要是为了实现自定义Collect…

Chrome中如何导出和导入书签

导出书签 如下图所示&#xff1a; 右上角三点->书签和清单->书签管理器->右上角三点->导出书签 然后你选择保存地址即可。打开后如下&#xff1a; 导入书签 如下图所示&#xff1a; 右上角三点->书签和清单->导入书签和设置->选择以前导出的书签&…

贪吃蛇(C语言实现)

贪食蛇&#xff08;也叫贪吃蛇&#xff09;是一款经典的小游戏。 —————————————————————— 本博客实现使用C语言在Windows环境的控制台中模拟实现贪吃蛇小游戏。 实行的基本功能&#xff1a; • 贪吃蛇地图的绘制 • 蛇吃食物的功能&#xff08;上、…

Pytorch学习 day08(最大池化层、非线性激活层、正则化层、循环层、Transformer层、线性层、Dropout层)

最大池化层 最大池化&#xff0c;也叫上采样&#xff0c;是池化核在输入图像上不断移动&#xff0c;并取对应区域中的最大值&#xff0c;目的是&#xff1a;在保留输入特征的同时&#xff0c;减小输入数据量&#xff0c;加快训练。参数设置如下&#xff1a; kernel_size&#…