OpenCV 图像透视变换详解

news2025/12/19 2:18:56

在计算机视觉领域，图像的视角问题常常会影响后续的分析与处理。例如，从倾斜角度拍摄的文档、带有畸变的场景图像等，都需要通过特定的方法进行矫正。OpenCV 作为计算机视觉领域的重要库，提供了强大的图像透视变换功能，能够帮助我们轻松解决这类问题。本文将深入讲解 OpenCV 图像透视变换的原理、实现方法，并结合实际案例进行演示。

一、透视变换原理

透视变换（Perspective Transformation）是指利用透视中心、像点、目标点三点共线的条件，按透视旋转定律使承影面（透视面）绕迹线（透视轴）旋转某一角度，破坏原有的投影光线束，仍能保持承影面上投影几何图形不变的变换。

在二维图像中，透视变换可以将一个四边形区域映射到另一个任意四边形区域，无论后者是否是矩形。透视变换可以用一个 3×3 的矩阵来表示，称为透视变换矩阵（Perspective Transformation Matrix）。该矩阵包含 8 个自由度，即需要 8 个方程来求解。一般通过在原图像和目标图像上选取 4 个对应点（这 4 个点在原图像和目标图像中不能共线），就可以计算出透视变换矩阵。

透视变换的数学表达式为：

\( \begin{bmatrix} x' \\ y' \\ 1 \end{bmatrix} = \begin{bmatrix} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33} \end{bmatrix} \begin{bmatrix} x \\ y \\ 1 \end{bmatrix} \)

其中，\((x, y)\) 是原图像中的点坐标，\((x', y')\) 是变换后图像中的点坐标。变换后的坐标 \((x', y')\) 需要通过除以变换后齐次坐标的第三个分量 \(a_{31}x + a_{32}y + a_{33}\) 来得到实际的二维坐标：

\( x' = \frac{a_{11}x + a_{12}y + a_{13}}{a_{31}x + a_{32}y + a_{33}} \)

\( y' = \frac{a_{21}x + a_{22}y + a_{23}}{a_{31}x + a_{32}y + a_{33}} \)

二、OpenCV 实现透视变换

在 OpenCV 中，实现透视变换主要通过 cv2.getPerspectiveTransform 和 cv2.warpPerspective 这两个函数来完成。

1. cv2.getPerspectiveTransform 函数

cv2.getPerspectiveTransform 函数用于计算透视变换矩阵。其函数原型如下：

cv2.getPerspectiveTransform(src, dst)

src：原图像中四边形顶点的坐标，数据类型为 numpy.array，形状为 (4, 2)。

dst：目标图像中对应四边形顶点的坐标，数据类型为 numpy.array，形状为 (4, 2)。

返回值：计算得到的 3×3 透视变换矩阵。

2. cv2.warpPerspective 函数

cv2.warpPerspective 函数用于对图像进行透视变换。其函数原型如下：

cv2.warpPerspective(src, M, dsize[, dst[, flags[, borderMode[, borderValue]]]])

src：输入的原图像。

M：由 cv2.getPerspectiveTransform 函数计算得到的透视变换矩阵。

dsize：输出图像的大小，格式为 (width, height)。

dst（可选）：输出图像，如果不指定，则会自动创建一个与 dsize 大小相同的图像。

flags（可选）：插值方法，默认值为 cv2.INTER_LINEAR。

borderMode（可选）：边界像素模式，默认值为 cv2.BORDER_CONSTANT。

borderValue（可选）：边界填充值，默认值为 0。

返回值：经过透视变换后的图像。

3. 代码示例

下面通过一个示例，演示如何使用 OpenCV 对一张倾斜的银行卡图像进行透视变换，将其矫正为正面视角。

import cv2

import numpy as np

# 读取图像

image = cv2.imread('bank_card.jpg')

# 定义原图像中银行卡的四个顶点坐标

src_points = np.float32([[111, 219], [287, 188], [37, 616], [253, 628]])

# 定义目标图像中对应的四个顶点坐标（假设目标图像为矩形）

dst_points = np.float32([[0, 0], [300, 0], [0, 400], [300, 400]])

# 计算透视变换矩阵

M = cv2.getPerspectiveTransform(src_points, dst_points)

# 进行透视变换

warped_image = cv2.warpPerspective(image, M, (300, 400))

# 显示原图像和变换后的图像

cv2.imshow('Original Image', image)

cv2.imshow('Warped Image', warped_image)

cv2.waitKey(0)

cv2.destroyAllWindows()

在上述代码中，首先读取银行卡图像，然后手动指定原图像中银行卡四个顶点的坐标，以及目标图像中对应的四个顶点坐标（这里将目标图像设定为一个固定大小的矩形）。接着通过 cv2.getPerspectiveTransform 函数计算透视变换矩阵，最后使用 cv2.warpPerspective 函数对图像进行透视变换，并显示结果。