目前最全的计算机视觉公开数据集汇总持续更新 400+数据集

news2026/3/16 8:48:06

总计：47个类别，涵盖约400+个具体数据集这47个类别基本覆盖了计算机视觉的全部主流研究领域，从底层图像处理（去噪/增强/修复）到中层视觉（检测/分割/跟踪），再到高层理解（识别/问答/推理），以及3D视觉、多模态学习和特殊应用场景。目录一、通用视觉基础数据集（分类/检测/分割）二、自动驾驶与智能交通三、视频理解与动作识别四、3D视觉与点云（物体/场景）五、遥感与航空图像六、医疗影像（诊断/分割/重建）七、视觉-语言多模态（CLIP/LLM训练）八、专业领域与新兴任务九、数据集聚合平台（一站式检索）十、细粒度视觉分类（Fine-Grained Visual Classification）十一、行人重识别（Person Re-identification）十二、第一人称/自我中心视角视觉（Egocentric Vision）十三、医学影像（补充）十四、低光/夜间视觉增强十五、图像去雾（Dehazing）十六、图像去雨（Deraining）十七、立体匹配与光流（Stereo Matching Optical Flow）十八、情感计算与面部属性十九、人脸检测二十、农业与植物表型二十一、零售与自动结算二十二、工业异常检测二十三、视频目标跟踪（Visual Object Tracking）二十四、多目标跟踪（Multi-Object Tracking, MOT）二十五、图像修复（Image Inpainting）二十六、阴影检测与去除（Shadow Detection/Removal）二十七、反射去除（Reflection Removal）二十八、单目深度估计（Monocular Depth Estimation）二十九、事件相机/神经形态视觉（Event-based Vision）三十、虚拟试穿与时尚（Virtual Try-on Fashion）三十一、文档理解（Document Understanding）三十二、步态识别（Gait Recognition）三十三、视觉问答（Visual Question Answering, VQA）三十四、显著性目标检测（Salient Object Detection）三十五、图像协调（Image Harmonization）三十六、视觉地点识别（Visual Place Recognition）三十七、3D点云分割（Point Cloud Segmentation）三十八、视频超分辨率（Video Super-Resolution）三十九、图像质量评估（Image Quality Assessment）四十、骨架动作识别（Skeleton-Based Action Recognition）四十一、神经辐射场/神经渲染（NeRF Neural Rendering）四十二、伪装目标检测（Camouflaged Object Detection, COD）四十三、水下图像增强（Underwater Image Enhancement）四十四、全景分割（Panoptic Segmentation）四十五、视频异常检测（Video Anomaly Detection）四十六、人群计数（Crowd Counting）四十七、小样本学习（Few-Shot Learning）一、通用视觉基础数据集（分类/检测/分割）表格数据集发布机构规模与特点适用任务下载地址ImageNet-1K/21K斯坦福李飞飞团队1400万+图像，2万+类别，CV领域黄金标准图像分类、预训练

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2412396.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！