five

arielnlee/Realistic-Occlusion-Dataset|图像分类数据集|遮挡处理数据集

收藏
hugging_face2023-07-03 更新2024-03-04 收录
图像分类
遮挡处理
下载链接:
https://hf-mirror.com/datasets/arielnlee/Realistic-Occlusion-Dataset
下载链接
链接失效反馈
资源简介:
真实遮挡数据集(ROD)是通过精心设计的对象收集协议创建的,旨在收集和捕捉来自16个类别的40多个不同对象的图像:香蕉、棒球、牛仔帽、杯子、哑铃、锤子、笔记本电脑、微波炉、鼠标、橙子、枕头、盘子、螺丝刀、煎锅、铲子和花瓶。图像在明亮的房间内使用iPhone 13 Pro超广角摄像头拍摄,背景为棕色木桌和纯色墙壁。遮挡物为红色或蓝色的木块或纸板,位置在相机与主物体之间,沿x轴从左到右变化。每个对象包括1张清晰图像和12张遮挡图像,总计1231个样本。该数据集用于测试模型在遮挡情况下的鲁棒性,特别是在论文《Hardwiring ViT Patch Selectivity into CNNs using Patch Mixing》中。
提供机构:
arielnlee
AI搜集汇总
数据集介绍
main_image_url
构建方式
在深度学习模型对遮挡处理能力的评估领域,Realistic Occlusion Dataset(ROD)的构建采用了精心的物体收集协议。该数据集通过在明亮的室内环境下,使用iPhone 13 Pro ultra-wide相机固定在三脚架上,从约90度的俯角和1米的距离,对16个类别的40+不同物体进行拍摄。每个物体在无遮挡和12种不同遮挡位置下各拍摄一次,遮挡物为红色或蓝色的木块或纸板,其位置沿x轴变化,从而形成了一个既包含清晰图像也包含遮挡图像的数据集。
特点
ROD数据集的显著特点在于其现实性,所有图像均在自然光线下捕捉,且物体均放置在棕色木桌上,背景为单一色墙。这种设置旨在模拟真实生活中的物体摆放与光照条件。此外,数据集的遮挡设计考虑了遮挡物的位置变化,从而为模型提供了丰富的遮挡情景,用以测试和提升其鲁棒性。数据集规模适中,包含1231个样本,涵盖了从香蕉到花瓶等日常物品。
使用方法
使用ROD数据集时,研究者可依据其提供的图像和标签进行模型训练、验证和测试。数据集以 splits 的形式组织,便于按需加载和操作。由于数据集包含了清晰的物体图像及其被不同方式遮挡的变体,研究者可专注于评估模型对遮挡的敏感性和鲁棒性。遵循相应的使用协议和许可,ROD数据集为计算机视觉领域中的遮挡处理研究提供了宝贵的资源。
背景与挑战
背景概述
在深度学习模型评估领域,确保模型在面对实际场景中的遮挡情况时仍能保持鲁棒性,是一个重要的研究方向。Realistic Occlusion Dataset(ROD)数据集应运而生,旨在为研究者提供一种新的测试方法,以评估模型在物体遮挡情形下的识别性能。该数据集由Ariel N. Lee等研究人员于2023年创建,包含16个类别的40+不同物体,通过精确的物体收集协议,捕捉了每个物体在自然光线下被遮挡和不被遮挡的图像。该数据集的创建,为视觉识别领域提供了一种新的评估标准,对模型鲁棒性研究具有显著影响。
当前挑战
ROD数据集在构建过程中面临的挑战主要包括:如何精确控制遮挡物的位置和大小,以确保数据集的有效性和一致性;如何在保持图像真实性的同时,避免过度人工干预。此外,数据集在解决物体识别领域中的遮挡问题时,也面临如何设计能够适应不同遮挡程度和类型的模型评估方法的挑战。
常用场景
经典使用场景
在图像识别领域,arielnlee/Realistic-Occlusion-Dataset数据集提供了一个独特的视角,其通过真实场景中的遮挡情况来测试模型的鲁棒性。该数据集包含16个类别的物体,每种物体都有12张被不同方式遮挡的图片以及一张清晰图片,这对于研究模型在部分信息遮挡下的表现尤为关键。
实际应用
在实际应用中,该数据集可被用于改进自动驾驶系统中的物体识别模块,使其在复杂交通环境中能更好地处理被遮挡的物体,从而提高行驶安全。此外,它也适用于智能家居系统,以提高对环境中被遮挡物品的识别精度。
衍生相关工作
基于此数据集,已有研究如Hardwiring ViT Patch Selectivity into CNNs using Patch Mixing等,探索了如何将遮挡处理能力硬编码进卷积神经网络,这些研究为深度学习模型在遮挡环境下的表现提供了新的视角和方法论。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Subway Dataset

该数据集包含了全球多个城市的地铁系统数据,包括车站信息、线路图、列车时刻表、乘客流量等。数据集旨在帮助研究人员和开发者分析和模拟城市交通系统,优化地铁运营和乘客体验。

www.kaggle.com 收录

COVID-19 Data Hub

COVID-19 Data Hub是一个全球性的COVID-19数据集,包含了来自多个国家和地区的疫情数据,涵盖了病例数、死亡数、康复数、测试数等信息。此外,数据集还包括了与疫情相关的经济、社会和政策数据。

covid19datahub.io 收录

OpenSonarDatasets

OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。

github 收录

HazyDet

HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。

arXiv 收录

GVJahnavi/Crops_set

该数据集包含图像和标签两个主要特征。图像特征的数据类型为图像,标签特征的数据类型为类标签,具体包括20种不同的植物病害和健康状态,如玉米的灰斑病、普通锈病、北方叶枯病,以及番茄的细菌性斑点病、早疫病、晚疫病等。数据集分为训练集和测试集,训练集包含25384个样本,测试集包含6346个样本。数据集的下载大小为514893426字节,总大小为474216412.07000005字节。

hugging_face 收录