【Opencv+Yolo】_Day1图像基本处理

news2026/3/12 15:54:00

一、计算机中的视觉：

二、Opencv基本操作：

图片基础处理：

视频基本处理：

图像截取（截取，合并，只保留一个元素）

图像填充

数值计算

图像融合

阈值判断

图像平滑

图像腐蚀和膨胀+开闭运算

梯度运算：

礼帽和黑帽

一、计算机中的视觉：

图像由像素点组成，像素点由数字矩阵组成（不同亮度：0-255）
R、G、B三个通道---彩色图
图像维度：[H,W,3]

二、Opencv基本操作：

图片基础处理：

图片读取cv2.imread('xx.jpg')

图片窗口cv2.imshow()

获取图片属性img.shape()

以灰度形式读取图片img=cv2.imread('.jpg',cv2.IMREAD_GRAYSCALE)

import cv2 #opencv默认读取BGR
import matplotlib.pyplot as plt
import numpy as np
%matplotlib inline

#图片读取基本步骤
img=cv2.imread('cat.jpg')
img
cv2.imshow('image',img) #窗口名称+图像
cv2.waitKey(0) #0任意键终止，1000就是1000毫秒的意思，一般用0
cv2.destroyAllWindows()

#获取图片属性
img.shape #H,W,C;C=3==RGB

#以灰度图形式读取
img=cv2.imread('cat.jpg',cv2.IMREAD_GRAYSCALE)
img
img.shape
cv_show('image',img)
#保存
cv2.imwrite('mycat.png',img)

或者可以把窗口写成一个函数

def cv_show(name,img)：

#define a fuction
def cv_show(name,img):
    cv2.imgshow(name,img)
    cv2.waitKey(0)
    cv2.destroyAllWindows()

视频基本处理：

首先读取视频路径，查看路径是否能够正确读取，显示窗口

#视频读取
#指定路径
vc=cv2.VideoCapture('test.mp4')
#检查是否打开正确
if vc.isOpened():
    open,frame = vc.read()#按顺序一帧一帧读取 open=True/false，第二个参数是当前帧的图像
else:
    open=False

while open:
    ret,frame = vc.read()
    if frame is not None:
        break
    if ret ==True:
        gray=cv2.cvtColor(frame,cv2.COLOR_BGR2GRAY)#转换成灰度图
        cv2.imshow('result',gray)
        if cv2.waitKey(100) & 0xFF ==27:
            break
vc.release()
cv2.destroyAllWindows()

图像截取（截取，合并，只保留一个元素）

注意opencv顺序是BGR

#截取部分图像
img=cv2.imread('cat.img')
cat=img[0:200,0:200]#ROI截取
cv_show('cat',cat)
#颜色通道提取BGR
b,g,r=cv2.split(img)
b
b.shape
g
g.shape#bgr大小相同
#合并
img=cv2.merge((b,g,r))
img.shape
#只保留R
cur_img=img.copy()
cur_img[:,:,0] = 0
cur_img[:,:,1] = 0
cv_show['R',cur_img]
#只保留G
cur_img=img.copy()
cur_img[:,:,0] = 0
cur_img[:,:,2] = 0
cv_show['G',cur_img]
#只保留B
cur_img=img.copy()
cur_img[:,:,1] = 0
cur_img[:,:,2] = 0
cv_show['B',cur_img]

图像填充

六种填充方法：

#边界填充
#上下左右分别填充大小
top_size,bottom_size,left_size,right_size = (50,50,50,50)
#复制法，复制最边缘像素
replicate = cv2.copyMakeBorder(img,top_size,bottom_size,left_size,right_size,borderType=cv2.BORDER_REPLICATE)
#反射法，对感兴趣的图像中的像素在两边进行复制abc cba
reflect = cv2.copyMakeBorder(img,top_size,bottom_size,left_size,right_size,borderType=cv2.BORDER_REFLECT)
#反射法，以最边缘像素为轴，对称 gfedcb|abcdefg|hgfedcba
reflect101 = cv2.copyMakeBorder(img,top_size,bottom_size,left_size,right_size,borderType=cv2.BORDER_REFLECT_101)
#外包装法，cedfgh|abcdefgh|abcdefg
wrap = cv2.copyMakeBorder(img,top_size,bottom_size,left_size,right_size,borderType=cv2.BORDER_WRAP)
#常量法，常数数值填充，0是黑框
constant = cv2.copyMakeBorder(img,top_size,bottom_size,left_size,right_size,cv2.BORDER_CONStant,value=0)
import matplotlib.pyplot as plt
plt.subplot(231),plt.imshow(img,'gray'),plt.title('ORIGINAL')
plt.subplot(232),plt.imshow(replicate,'gray'),plt.title('replicate')
plt.subplot(233),plt.imshow(reflect,'gray'),plt.title('reflect')
plt.subplot(234),plt.imshow(reflect101,'gray'),plt.title('reflect101')
plt.subplot(235),plt.imshow(wrap,'gray'),plt.title('wrap')
plt.subplot(236),plt.imshow(constant,'gray'),plt.title('constant')
plt.show()

数值计算

cv2.add（img1，img2）超过255，直接等于255

图像融合

必须两个图片size大小相同才可以融合

R = a*x1+b*x2+c 权重和偏置项

#想实现img_cat+img_dog
img_cat.shape
#resize变成猫图片的大小
img_dog=cv2.resize(img_dog,(500,414)
res=cv2.addWeighted(img_cat,0.4,img_dog,0.6,0)
plt.show(res)

cv2.resize()还可以用作图片伸缩

#当不知道图片伸缩多少时，可以把x变成原来的1.5倍
res=cv2.resize(img,(0,0),fx=1.5,fy=1)

阈值判断

THRESH_BINARY:亮的全为白，黑的全为黑

THRESH_BINARY_INV：<127变成255，亮的变成黑的，黑的变成白的

THRESH_TRUNC:>127变成127，剩下的不改变，黑色部分不改变

THRESH_TOZERO:<127的变成0，黑色的部分更暗

图像平滑

均值滤波：

相当于构造一个filter=简单平均卷积操作

方框滤波：大于255的直接等于255

高斯滤波：构建高斯分布

中值滤波：使用中间值替代

#图像平滑
img2=cv2.imread('lenaNoise.png')
cv2.imshow('img',img)
cv2.waitKey(0)
cv2.destroyAllWindows()
#均值滤波加起来除个数求均值，一般选（3，5，7）
blur=cv2.blur(img,(3,3))
cv2.imshow('blur',blur)
cv2.waitKey(0)
cv2.destroyAllWindows()
#方框滤波，基本和均值一样，可以选择归一化,大于255直接就是255
blur=cv2.boxFilter(img,-1,(3,3),normalize=True)
#高斯滤波，卷积核满足高斯分布
aussian = cv2.GaussianBlur(img,(5,5),1)
cv2.imshow('aussian',aussian)
cv2.waitKey(0)
cv2.destroyAllWindows()
#中值滤波，从小到大排序找中间值，中间值代替，不考虑噪声,推荐
median = cv2.medianBlur(img,5)
cv2.imshow('medien',medien)
cv2.waitKey(0)
cv2.destroyAllWindows()

三、图像形态学操作

图像腐蚀和膨胀+开闭运算

当图片有一些杂纹，需要通过腐蚀来去掉

当腐蚀之后，可能对原图片有伤害，就要用膨胀恢复

#腐蚀操作，外面的颜色腐蚀里面，去掉杂纹
img=cv2.imread('dige.png')
cv2.imshow('img',img)
cv2.destoryAllWindows()
kernel = np.ones((3,3),np.unit8)
dige_erosion = cv2.erode(img,kernel,iterations = 1)
cv2.imshow('erosion',erosion)
cv2.waitKey(0)
cv2.destroyAllWindows()
#膨胀操作,里面的颜色扩张
kernel = np.ones((3,3),np.unit8)
dige_dilate = cv2.dilate(dige_erosion,kernel,iterations = 1)
cv2.imshow('dilate',dige_dilate)
cv2.waitKey(0)
cv2.destroyAllWindows()

开运算：先腐蚀，再膨胀
闭运算：先膨胀，再腐蚀

#开运算：先腐蚀，再膨胀
img= cv2.imread('dige.png')
kernel = np.ones((5,5),np.unit8)
opening = cv2.morphologyEx(img,cv2.MORPH_OPEN,kernel)
#闭运算：先膨胀，再腐蚀
closing = cv2.morphologyEx(img,cv2.MORPH_CLOSE,kernel)

梯度运算：

得到轮廓边界信息

#梯度运算：
#梯度=膨胀-腐蚀
pie= cv2.imread('pie.png')
kernel = np.ones((7,7),np.unit8)
dilate = cv2.dilate(pie,kernel,iterations = 5)
erosion = cv2.erode(pie,kernel,iterations = 5)
res = np.hstack((dilate,erosion))
gradient = cv2.morphologyEx(pie,cv2.MORPH_GRADIENT,kernel)

礼帽和黑帽

礼帽=原始输入-开运算(原始的杂纹=原始-无杂纹）TOPHAT

黑帽=闭运算-原始输入（原始的小轮廓）BLACKHAT

#礼帽=原始输入-开运算(原始的杂纹=原始-无杂纹）
img= cv2.imread('dige.png')
tophat=cv2.morphologyEx(img,cv2.MORPH_TOPHAT,kernel)
#黑帽=闭运算-原始输入（原始的小轮廓）
blackhat=cv2.morphologyEx(img,cv2.MORPH_BLACKHAT,kernel)

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2386847.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！