一、多模态数据采集与预处理模块
设计目标:解决动态场景中多源数据的时空对齐与质量优化问题,为后续特征提取提供高精度、强一致性的输入。
1.1 传感器配置逻辑
选择 RGB-D 相机(如 Kinect)与 LiDAR(如 Velodyne VLP-16)的互补组合,原因在于:
- RGB-D 相机提供高分辨率的 2D 彩色图像与稠密深度图(但有效范围有限,通常 < 10m);
- LiDAR 通过激光扫描获取大场景(>100m)的稀疏点云(但无颜色信息);
二者融合可覆盖近 - 中 - 远场场景,兼顾细节与全局信息。
1.2 数据校准关键步骤
- 内参标定:张正友标定法通过棋盘格图案的多角度拍摄,可高效获取相机的焦距、主点等参数(误差通常 < 0.5 像素);
- 外参对齐:手眼标定(如基于 OpenCV 的
calibrateHandEye
)需采集传感器在不同位姿下的同步数据,通过 SVD 分解求解旋转矩阵与平移向量(建议至少采集 10 组不同位姿数据以保证精