ros2--图像/image

news2025/6/6 16:31:46

原始图像

接口类型:

压缩图像

接口类型:

sensor_msgs/msg/CompressedImage

ros2 interface show sensor_msgs/msg/CompressedImage 
# This message contains a compressed image.

std_msgs/Header header # Header timestamp should be acquisition time of image
        builtin_interfaces/Time stamp
                int32 sec
                uint32 nanosec
        string frame_id
                             # Header frame_id should be optical frame of camera
                             # origin of frame should be optical center of cameara
                             # +x should point to the right in the image
                             # +y should point down in the image
                             # +z should point into to plane of the image

string format                # Specifies the format of the data
                             #   Acceptable values:
                             #     jpeg, png, tiff

uint8[] data                 # Compressed image buffer

1. header (std_msgs/Header)

消息的头部信息,包含时间戳和坐标系标识:

  • stamp (builtin_interfaces/Time)

    • sec (int32): 时间戳的秒部分

    • nanosec (uint32): 时间戳的纳秒部分

    • 作用:表示图像的采集时间(通常是相机捕获图像的时刻)。

  • frame_id (string)

    • 作用:定义图像的坐标系(通常是相机的光学坐标系)。

    • 坐标系约定

      • 原点:相机的光学中心(光心)。

      • +x:指向图像的右侧

      • +y:指向图像的下方

      • +z:指向图像平面内(即光轴方向)。


2. format (string)

指定图像的压缩格式,常见值包括:

  • "jpeg""png""tiff"(ROS 支持的压缩格式)。

  • 作用:告知解码器如何解析后续的 data 字段。


3. data (uint8[])

存储压缩后的图像数据的字节数组:

  • 编码方式:由 format 字段指定(如 JPEG、PNG 等)。

  • 特点

    • 二进制数据,直接存储压缩后的字节流。

    • 相比原始图像(sensor_msgs/Image),体积更小,适合带宽有限的场景。

关键区别:CompressedImage vs 原始 Image

  • 原始图像 (sensor_msgs/Image)

    • 包含未压缩的像素数据(如 rgb8bgr8mono8 等格式)。

    • 数据量大,占用带宽高。

  • 压缩图像 (CompressedImage)

    • 通过 format 指定压缩算法(如 JPEG/PNG),data 存储压缩后的二进制流。

    • 需解码后才能使用(如用 OpenCV 的 cv_bridge)。

图像压缩算法和像素格式

图像的本质

图像的数据本质上是 像素值的集合,存储了每个点的颜色或亮度信息。

  • 在内存中的表示

    • 图像是一个多维数组(如OpenCV中的ndarray)。

    • 例如:

      • 灰度图:shape=(H, W),每个像素是 0(黑)到 255(白)的整数(uint8)。

      • 彩色图:shape=(H, W, 3),每个像素是 [B, G, R] 三个通道的值(OpenCV默认顺序)。

  • 在文件中的表示

    • 未压缩格式(如BMP):直接存储像素值,文件较大。

    • 压缩格式(如JPEG/PNG):通过算法减少存储空间。

-- 所以先有像素,再有图像压缩算法。

图像压缩算法

作用

主要用于减少图像数据的体积,分为无损压缩有损压缩

分类

(1) 无损压缩

压缩后可以完全恢复原始数据,适合需要精确像素的场景(如医学影像、卫星图像)。

  • PNG (Portable Network Graphics)

    • 支持透明通道(Alpha通道),适合保存带遮罩的图像。

    • 压缩率较高,但比JPEG慢。

  • TIFF (Tagged Image File Format)

    • 支持多图层、多通道,常用于专业摄影和印刷。

  • BMP (位图)

    • 无压缩,文件体积大,ROS中较少使用。

(2) 有损压缩

牺牲部分图像质量以换取更高的压缩率,适合实时传输(如摄像头数据)。

  • JPEG (Joint Photographic Experts Group)

    • 最常用的有损压缩格式,适用于自然场景(照片)。

    • 不支持透明通道,压缩率高,但可能产生块状伪影(Blocking Artifacts)。

  • WebP

    • Google开发,比JPEG更高的压缩率,支持透明通道。

  • HEIF/HEIC

    • 苹果推广的高效图像格式,压缩率优于JPEG。

像素格式(Pixel Formats)

本质和作用

像素格式定义了图像数据存储方式解释规则。

注意:计算机中任何数据都是01二进制,所以图像数据也是01二进制数据。

像素格式由很多标准组成:

  1. 颜色通道(Channels)

决定图像的色彩信息如何存储,是像素格式最关键的组成部分。

  • 常见类型

通道数量格式示例说明
1mono8单通道灰度图(0=黑,255=白)
3bgr8/rgb8三通道彩色图(BGR是OpenCV默认顺序,RGB是通用标准)
4bgra8四通道(含Alpha透明通道,0=透明,255=不透明)
其他yuv422多通道非RGB格式(如YUV用于视频压缩)
  • 特殊通道排列

    • Bayer格式(如bayer_rggb):原始相机传感器的单通道排列,需解马赛克(Demosaicing)转换为RGB。


  1. 位深度(Bit Depth)

定义每个通道的数值范围和精度,影响图像的动态范围和存储大小。

位深度数据类型数值范围典型用途
8位uint80~255普通图像(JPEG/PNG)
16位uint160~65535医学影像、深度传感器
32位float32浮点数(如0.0~1.0)高动态范围(HDR)、深度图

示例

  • mono16:16位灰度图,可表示更精细的亮度层次。

  • 32FC1:32位浮点单通道,用于存储深度值(单位:米)。


  1. 数据布局(Memory Layout)

定义像素值在内存中的排列方式,影响数据读取效率。

  • 交错存储(Interleaved)

    • 通道值按像素顺序排列(如BGRBGRBGR...)。

    • 适用于大多数彩色图像(如OpenCV的bgr8)。

  • 平面存储(Planar)

    • 所有像素的同一通道连续存储(如RRRR...GGGG...BBBB...)。

    • 常见于视频编码(如YUV420)。

示例对比

  • bgr8(Interleaved):[B1,G1,R1, B2,G2,R2, ...]

  • yuv420(Planar):[Y1,Y2,...,Yn, U1,U2..., V1,V2...]


  1. 颜色空间(Color Space)

定义如何将数值映射到实际颜色,影响色彩还原效果。

颜色空间说明
RGB/BGR基于红、绿、蓝三原色的加色模型,最常用。
YUV/YCrCb分离亮度(Y)和色度(UV),用于视频压缩(如JPEG、H.264)。
HSV/HSL用色调(H)、饱和度(S)、亮度(V/L)表示,适合颜色分析。
Grayscale单通道亮度值,无色彩信息。

示例

  • 摄像头原始数据可能是YUV422,需转换为BGR才能在OpenCV中正确显示。

分类

(1) 常见彩色格式

格式名说明
rgb8红-绿-蓝,每个通道8位(24位色)
bgr8蓝-绿-红(OpenCV默认格式)
rgba8红-绿-蓝-透明(32位)
bgra8蓝-绿-红-透明(OpenCV带Alpha通道)
yuv422YUV颜色空间,用于部分摄像头
yuv420更紧凑的YUV格式(视频常用)

(2) 灰度(单通道)格式

格式名说明
mono88位灰度图(0=黑,255=白)
mono1616位灰度图(0~65535)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2401871.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Rust 学习笔记:关于智能指针的练习题

Rust 学习笔记:关于智能指针的练习题 Rust 学习笔记:关于智能指针的练习题问题一问题二问题三问题四问题五问题六问题七问题八问题九问题十 Rust 学习笔记:关于智能指针的练习题 参考视频: https://www.bilibili.com/video/BV1S…

6.RV1126-OPENCV 形态学基础膨胀及腐蚀

一.膨胀 1.膨胀原理 膨胀的本质就是通过微积分的转换,将图像A和图形B进行卷积操作合并成一个AB图像。核就是指任意的形状或者大小的图形B。例如下图,将核(也就是图形B)通过微积分卷积,和图像A合并成一个图像AB。 2.特点 图像就会更加明亮 …

筑牢企业网管域安全防线,守护数字核心——联软网管域安全建设解决方案

在当今数字化浪潮中,企业网管域作为数据中心的核心,其安全防护至关重要。一旦网管域遭受攻击,整个网络系统可能陷入瘫痪,给企业带来巨大损失。联软科技凭借其创新的网管域安全建设解决方案,为企业提供了全方位的安全保…

【目标检测】backbone究竟有何关键作用?

backbone的核心在于能为检测提供若干种感受野大小和中心步长的组合,以满足对不同尺度和类别的目标检测。

一个小小的 flask app, 几个小工具,拼凑一下

1. 起因, 目的: 自己的工具,为自己服务。给大家做参考。项目地址: https://github.com/buxuele/flask_utils 2. 先看效果 3. 过程: 一个有趣的 Flask 工具集:从无到有的开发历程 缘起:为什么要做这个项目&#xff…

对抗性提示:大型语言模型的安全性测试

随着大语言模型(LLM)在虚拟助手、企业平台等现实场景中的深度应用,其智能化与响应速度不断提升。然而能力增长的同时,风险也在加剧。对抗性提示已成为AI安全领域的核心挑战,它揭示了即使最先进的模型也可能被操纵生成有…

好得睐:以品质守味、以科技筑基,传递便捷与品质

据相关数据显示,超市半成品菜是冻品区增长最快品类,再加上商超渠道作为消费者日常高频接触场景,是促进半成品菜成为冻品生鲜消费领域的关键一环。好得睐作为半成品菜领军品牌,其商超渠道布局是连接消费者与品质生活的重要桥梁。商…

docker-部署Nginx以及Tomcat

一、docker 部署Nginx 1、搜索镜像(nginx) [rootlocalhost /]# docker search nginx Error response from daemon: Get "https://index.docker.io/v1/search?qnginx&n25": dial tcp 192.133.77.133:443: connect: connection refused 简…

蒙特卡罗模拟: 高级应用的思路和实例

蒙特卡罗模拟不仅仅是一种理论练习,它还是一种强大的工具,在金融、医疗保健、物流等领域都有实际应用。本篇文章将探讨高级和复杂的现实生活场景,深入探讨它们的细微差别,并通过详细的解释在 Python 中实现它们。 什么是蒙特卡罗…

数据分析Agent构建

数据分析agent构建 代码资料来源于 Streamline-Analyst,旨在通过该仓库上的代码了解如何使用大语言模型构建数据分析工具; 个人仓库:Data-Analysis-Agent-Tutorial 不同的在于 Data-Analysis-Agent-Tutorial 是在 Streamline-Analyst 基础…

vscode配置lua

官网下载lua得到如下 打开vscode的扩展下载如下三个 打开vscode的此处设置 搜索 executorMap,并添加如下内容

【笔记】MSYS2 的 MINGW64 环境 全面工具链

#工作记录 MSYS2 的 MINGW64 环境(mingw64.exe),下面是为该环境准备的最全工具链安装命令(包括 C/C、Python、pip/wheel、GTK3/GTK4、PyGObject、Cairo、SDL2 等)。 这一环境适用于构建原生 64 位 Windows 应用程序。…

国内头部的UWB企业介绍之品铂科技

一、核心优势与技术实力‌ ‌厘米级定位精度‌ 自主研发的ABELL无线实时定位系统,在复杂工业环境中实现静态与动态场景下‌10-30厘米‌高精度定位,尤其擅长金属设备密集的化工、电力等场景,抗干扰能力行业领先。‌多技术融合能力‌ 支持卫星…

Prj10--8088单板机C语言8259中断测试(2)

1.测试结果 2.全部代码 #include "tiny_stdarg.h" // 使用自定义可变参数实现#define ADR_273 0x0200 #define ADR_244 0x0400 #define LED_PORT 0x800 #define PC16550_THR 0x1f0 #define PC16550_LSR 0x1f5 / //基本的IO操作函数 / char str[]"Hel…

35.x64汇编写法(二)

免责声明:内容仅供学习参考,请合法利用知识,禁止进行违法犯罪活动! 本次游戏没法给 内容参考于:微尘网络安全 上一个内容:34.x64汇编写法(一) 上一个内容写了,汇编调…

安全大模型的思考

马上要准备2025年的护网了,最近就一直很忙,被事情裹挟着前进,忙的晕头转向,近乎感冒,昨天部门搞了一场AI大模型培训,演讲者有着很深的技术底蕴,我听到了一句关于Sass数据验证这块大为感悟&#…

NineData云原生智能数据管理平台新功能发布|2025年5月版

本月发布 6 项更新,其中重点发布 3 项、功能优化 3 项。 重点发布 数据库 DevOps - 多源敏感数据保护 敏感数据扫描能力大幅扩展,新增支持 TiDB、Doris、SelectDB、OceanBase MySQL、GreatSQL、StarRocks、ClickHouse、SingleStore、Lindorm 9 种大数据…

Linux可执行文件ELF文件结构

目标文件格式 编译器编译源代码后生成的文件叫做目标文件,而目标文件经过编译器链接之后得到的就是可执行文件。那么目标文件到底是什么?它和可执行文件又有什么区别?链接到底又做了什么呢?接下来,我们将探索一下目标…

DisplayPort 2.0协议介绍(1)

最近开始学习DisplayPort 2.0协议,相比于DP1.4a,最主要的是速率提升到了10Gbps/lane,还有就是128b/132b编码方式的修改。至于速率13.5Gbps和20Gbps还只是可选项,在DP2.1协议才成为必须支持选项。 那在实现技术细节上有哪些变化呢…

I2C通信讲解

I2C总线发展史 怎么在一条串口线上连接多个设备呢? 由于速度同步线是由主机实时发出的,所以主机可以按需求修改通信速度,这样在一条线上可以挂接不同速度的器件,单片机和性能差的器件通信,就输出较慢的脉冲信号&#x…