文章目录
- 前言
- 一、读取深度值与图像
- 1、深度值读取
- 2、图像读取
 
- 二、深度图可视化
- 1、深度图可视化代码
- 2、深度图可视化结果展示
 
- 三、深度图在图像上可视化
- 1、可视化代码
- 2、可视化坐标显示
 
- 四、完整代码
前言
kitti数据是一个通用数据,有关kitti的深度图像内容我已有博客介绍。这里,我将给出一个工具,用于显示深度值对应像素坐标再图像上,也给出深度值可视化显示内容。
一、读取深度值与图像
很简单,直接使用cv与PIL库可实现数据读取,其调用代码如下:
    path = './data/2011_09_26_drive_0001_sync'
    index = '0000000005'
    image_2_path = os.path.join(path, '2011_09_26_drive_0001_sync/2011_09_26/2011_09_26_drive_0001_sync/image_02/data', index + '.png') # 获得图像
    depth_path = os.path.join(path,'2011_09_26_drive_0001_sync/proj_depth/groundtruth/image_02',index+'.png')
    groundtruth = depth_read(depth_path)
    img = get_image(image_2_path)  # 读取图像
1、深度值读取
使用官网提供方法,该方法得到是真实相机坐标系下z轴距离,我会在后面图显示,其代码如下:
def depth_read(filename):
    # loads depth map D from png file
    # and returns it as a numpy array,
    # for details see readme.txt
    depth_png = np.array(Image.open(filename), dtype=int)
    # make sure we have a proper 16bit depth map here.. not 8bit!
    assert(np.max(depth_png) > 255)
    depth = depth_png.astype(np.float) / 256.
    # depth[depth_png == 0] = -1.
    return depth
2、图像读取
图像是对应的深度图的图像,以相机02为准,其代码如下:
def get_image(img_path):
    img = cv2.imread(img_path)
    return img
二、深度图可视化
显然,我们只需使用深度图信息即可实现。
1、深度图可视化代码
直接使用plt可实现,其代码如下:
def show_depth(groundtruth):
    # import numpy as np
    # import matplotlib.pyplot as plt
    # 假设我们有深度数据存储在一个名为depth_data的NumPy数组中。
    # 这个数组应该具有与你的图像相同的形状。
    # 转换深度数据到0-1范围内的浮点数
    normalized_depth = groundtruth.astype(np.float32) / groundtruth.max()
    # 创建一个颜色映射,从蓝色(最小值)到黄色(最大值)
    cmap = plt.get_cmap('viridis')
    # 使用颜色映射创建一个新的图像
    color_image = cmap(normalized_depth)
    # 删除alpha通道(如果有的话)
    if color_image.shape[-1] == 4:
        color_image = color_image[..., :3]
    # 显示新的彩色图像
    plt.imshow(color_image)
    plt.colorbar()
    plt.show()
2、深度图可视化结果展示

三、深度图在图像上可视化
1、可视化代码
明显,我目的是要将对应深度图值显示在对应图像上,其代码如下:
def show_depth2img(img,groundtruth,interval_x=100, interval_y=20):
    """
    将深度图对应深度图值按照约定行与列像素打印到图像上方法
    :interval_x=100:x坐标按照多少像素取值,决定x方向间隔
    :interval_y=20:y坐标按照多少像素取值,决定y方向间隔
    :param img: 原始图像内容
    :param groundtruth: 深度图值
    :return: 返回一个显示深度图值在图像上
    """
    h, w = img.shape[:2]
    # interval_x, interval_y = 100, 20  # w与h相隔多少像素显示内容
    numpy_y, numpy_x = int(h / interval_y), int(w / interval_x)
    for i in range(numpy_x):
        for j in range(numpy_y):
            x = int(interval_x * i)
            y = int(interval_y * j)
            value = groundtruth[y, x]
            img = draw_circle_coord(img, coord=(x, y), value=value)
2、可视化坐标显示

 你会发现有很多值是0,这是正常的。你也发现数值确实也是kitti官网说的,是真实距离坐标,确实是这样的,如图显示。
四、完整代码
最后,我给出一个完整代码,可以直接执行,其代码如下:
import os
import cv2
import numpy as np
import matplotlib.pyplot as plt
def get_image(img_path):
    img = cv2.imread(img_path)
    return img
def show_img(img):
    plt.imshow(img)
    plt.show()
from PIL import Image
def depth_read(filename):
    # loads depth map D from png file
    # and returns it as a numpy array,
    # for details see readme.txt
    depth_png = np.array(Image.open(filename), dtype=int)
    # make sure we have a proper 16bit depth map here.. not 8bit!
    assert(np.max(depth_png) > 255)
    depth = depth_png.astype(np.float) / 256.
    # depth[depth_png == 0] = -1.
    return depth
def show_depth(groundtruth):
    # import numpy as np
    # import matplotlib.pyplot as plt
    # 假设我们有深度数据存储在一个名为depth_data的NumPy数组中。
    # 这个数组应该具有与你的图像相同的形状。
    # 转换深度数据到0-1范围内的浮点数
    normalized_depth = groundtruth.astype(np.float32) / groundtruth.max()
    # 创建一个颜色映射,从蓝色(最小值)到黄色(最大值)
    cmap = plt.get_cmap('viridis')
    # 使用颜色映射创建一个新的图像
    color_image = cmap(normalized_depth)
    # 删除alpha通道(如果有的话)
    if color_image.shape[-1] == 4:
        color_image = color_image[..., :3]
    # 显示新的彩色图像
    plt.imshow(color_image)
    plt.colorbar()
    plt.show()
def draw_circle_coord(image,coord=None,value=None):
    if coord is not None and value is not None:
        coord = tuple(coord)
        image = cv2.circle(image, coord, 5, (255, 0, 0), -1)
        value = round(value,2)
        image = cv2.putText(image, str(value)+'m', coord, cv2.FONT_HERSHEY_COMPLEX, 0.6, (0, 0, 255), 1, cv2.LINE_AA)
    return image
def show_depth2img(img,groundtruth,interval_x=100, interval_y=20):
    """
    将深度图对应深度图值按照约定行与列像素打印到图像上方法
    :interval_x=100:x坐标按照多少像素取值,决定x方向间隔
    :interval_y=20:y坐标按照多少像素取值,决定y方向间隔
    :param img: 原始图像内容
    :param groundtruth: 深度图值
    :return: 返回一个显示深度图值在图像上
    """
    h, w = img.shape[:2]
    # interval_x, interval_y = 100, 20  # w与h相隔多少像素显示内容
    numpy_y, numpy_x = int(h / interval_y), int(w / interval_x)
    for i in range(numpy_x):
        for j in range(numpy_y):
            x = int(interval_x * i)
            y = int(interval_y * j)
            value = groundtruth[y, x]
            img = draw_circle_coord(img, coord=(x, y), value=value)
if __name__ == '__main__':
    path = './data/2011_09_26_drive_0001_sync'
    index = '0000000005'
    image_2_path = os.path.join(path, '2011_09_26_drive_0001_sync/2011_09_26/2011_09_26_drive_0001_sync/image_02/data', index + '.png') # 获得图像
    depth_path = os.path.join(path,'2011_09_26_drive_0001_sync/proj_depth/groundtruth/image_02',index+'.png')
    groundtruth = depth_read(depth_path)
    img = get_image(image_2_path)  # 读取图像
    show_depth(groundtruth)  # 显示深度图
    img = show_depth2img(img, groundtruth, interval_x=100, interval_y=20)
    cv2.imwrite('out_dir/draw_coord.png',img)
    show_img(img)



















