目前最全的计算机视觉公开数据集汇总 持续更新 400+数据集
总计:47个类别,涵盖约400+个具体数据集这47个类别基本覆盖了计算机视觉的全部主流研究领域,从底层图像处理(去噪/增强/修复)到中层视觉(检测/分割/跟踪),再到高层理解(识别/问答/推理),以及3D视觉、多模态学习和特殊应用场景。目录一、通用视觉基础数据集(分类/检测/分割)二、自动驾驶与智能交通三、视频理解与动作识别四、3D视觉与点云(物体/场景)五、遥感与航空图像六、医疗影像(诊断/分割/重建)七、视觉-语言多模态(CLIP/LLM训练)八、专业领域与新兴任务九、数据集聚合平台(一站式检索)十、细粒度视觉分类(Fine-Grained Visual Classification)十一、行人重识别(Person Re-identification)十二、第一人称/自我中心视角视觉(Egocentric Vision)十三、医学影像(补充)十四、低光/夜间视觉增强十五、图像去雾(Dehazing)十六、图像去雨(Deraining)十七、立体匹配与光流(Stereo Matching Optical Flow)十八、情感计算与面部属性十九、人脸检测二十、农业与植物表型二十一、零售与自动结算二十二、工业异常检测二十三、视频目标跟踪(Visual Object Tracking)二十四、多目标跟踪(Multi-Object Tracking, MOT)二十五、图像修复(Image Inpainting)二十六、阴影检测与去除(Shadow Detection/Removal)二十七、反射去除(Reflection Removal)二十八、单目深度估计(Monocular Depth Estimation)二十九、事件相机/神经形态视觉(Event-based Vision)三十、虚拟试穿与时尚(Virtual Try-on Fashion)三十一、文档理解(Document Understanding)三十二、步态识别(Gait Recognition)三十三、视觉问答(Visual Question Answering, VQA)三十四、显著性目标检测(Salient Object Detection)三十五、图像协调(Image Harmonization)三十六、视觉地点识别(Visual Place Recognition)三十七、3D点云分割(Point Cloud Segmentation)三十八、视频超分辨率(Video Super-Resolution)三十九、图像质量评估(Image Quality Assessment)四十、骨架动作识别(Skeleton-Based Action Recognition)四十一、神经辐射场/神经渲染(NeRF Neural Rendering)四十二、伪装目标检测(Camouflaged Object Detection, COD)四十三、水下图像增强(Underwater Image Enhancement)四十四、全景分割(Panoptic Segmentation)四十五、视频异常检测(Video Anomaly Detection)四十六、人群计数(Crowd Counting)四十七、小样本学习(Few-Shot Learning)一、通用视觉基础数据集(分类/检测/分割)表格数据集发布机构规模与特点适用任务下载地址ImageNet-1K/21K斯坦福李飞飞团队1400万+图像,2万+类别,CV领域黄金标准图像分类、预训练
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2412396.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!