five

COCO-Occ|全景分割数据集|遮挡问题数据集

收藏
arXiv2024-09-19 更新2024-09-26 收录
全景分割
遮挡问题
下载链接:
http://arxiv.org/abs/2409.12760v1
下载链接
链接失效反馈
资源简介:
COCO-Occ数据集是由华威大学计算机科学系的研究团队基于COCO数据集创建的,旨在解决全景分割和图像理解中的遮挡问题。该数据集包含35,000张图像,分为30,000张训练图像和5,000张测试图像,每张图像都经过手动标注,分为低、中、高三个遮挡等级。数据集的创建过程包括使用COCO API叠加多边形掩码,并根据遮挡率手动分类图像。COCO-Occ数据集主要应用于全景分割任务,旨在提高模型在不同遮挡程度下的表现,特别是在高遮挡情况下的性能。
提供机构:
华威大学
创建时间:
2024-09-19
AI搜集汇总
数据集介绍
main_image_url
构建方式
COCO-Occ数据集的构建基于COCO数据集,通过人工标注的方式将图像分为三个感知遮挡级别:低、中和高。具体步骤包括:首先,使用COCO API将多边形掩码叠加到选定的图像上,以更准确地描绘对象区域;其次,计算遮挡区域与整个被遮挡对象(包括被遮挡部分)的比率,即遮挡率;最后,根据遮挡率将图像手动分类为低、中、高三个遮挡级别。这种直接且劳动密集的方法确保了遮挡级别的准确性,从而形成了COCO-Occ数据集。
特点
COCO-Occ数据集的主要特点在于其针对遮挡问题的细致标注和分类。该数据集包含35,000张图像,其中30,000张用于训练,5,000张用于验证,每张图像都被标注为低、中、高三个遮挡级别之一。这种详细的遮挡级别标注使得研究人员能够系统地评估和量化遮挡对全景分割任务的影响,为遮挡问题的研究提供了宝贵的资源。此外,COCO-Occ数据集的规模和多样性使其成为测试和开发遮挡感知模型的理想平台。
使用方法
COCO-Occ数据集主要用于全景分割和图像理解任务的研究。研究人员可以使用该数据集来训练和评估模型在不同遮挡级别下的性能,从而开发出更鲁棒的遮挡感知算法。具体使用方法包括:首先,利用数据集中的遮挡标注进行模型训练,通过对比学习等方法提升模型对遮挡的识别能力;其次,在验证集上测试模型的性能,分析其在不同遮挡级别下的表现;最后,通过实验验证和对比,优化和改进模型,以提高其在实际应用中的遮挡处理能力。
背景与挑战
背景概述
COCO-Occ数据集由英国华威大学的Wenbo Wei、Jun Wang和Abhir Bhalerao等人创建,旨在解决全景分割和图像理解中的遮挡问题。该数据集基于COCO数据集,通过手动标注图像的遮挡级别,将其分为低、中、高三个等级,包含30,000张训练图像和5,000张测试图像。COCO-Occ的推出填补了现有数据集在遮挡分析方面的空白,为研究遮挡对全景分割性能的影响提供了重要资源,推动了计算机视觉领域的发展。
当前挑战
COCO-Occ数据集面临的挑战主要集中在两个方面:一是解决全景分割任务中遮挡问题的复杂性,现有算法在处理高遮挡级别时性能显著下降;二是数据集构建过程中的标注难度,手动标注遮挡级别需要大量的人力和时间,且准确性依赖于标注者的主观判断。此外,如何有效利用遮挡标注信息,提升模型在不同遮挡级别下的鲁棒性,也是当前研究的重要课题。
常用场景
经典使用场景
COCO-Occ数据集在全景分割和图像理解任务中展现了其经典应用场景。通过手动标注COCO图像中的遮挡级别,该数据集为研究遮挡问题提供了丰富的资源。研究者们利用COCO-Occ数据集,系统地评估了现有最先进的全景分割模型在不同遮挡级别下的表现,揭示了遮挡对模型性能的显著影响。此外,数据集还支持通过对比学习方法提升模型对遮挡的鲁棒性,从而在全景分割任务中取得更优的表现。
解决学术问题
COCO-Occ数据集解决了全景分割和图像理解领域中长期存在的遮挡问题。遮挡是影响计算机视觉任务性能的关键因素之一,尤其是在物体检测和实例分割中。通过提供详细的遮挡级别标注,COCO-Occ数据集为学术界提供了一个量化遮挡影响的基准,推动了遮挡感知模型的研究。这不仅有助于提升现有模型的性能,还为开发更鲁棒的遮挡处理算法奠定了基础。
衍生相关工作
COCO-Occ数据集的发布催生了多项相关研究工作,特别是在遮挡感知的全景分割和图像理解领域。例如,基于COCO-Occ数据集,研究者们提出了多种遮挡处理模型,如Compositional Convolutional Neural Networks和Occlusion Reasoning Module,这些模型在处理遮挡问题上表现出色。此外,对比学习方法的引入也为遮挡问题的解决提供了新的思路,推动了遮挡感知特征表示的研究。这些衍生工作不仅丰富了计算机视觉领域的研究内容,也为实际应用提供了强有力的技术支持。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

ROBEL

ROBEL是一个开源的低成本机器人平台,专为现实世界的强化学习设计。该平台由谷歌研究院和加州大学伯克利分校共同开发,包含两个机器人:D'Claw,一个三指手机器人,用于促进精细操作任务的学习;D'Kitty,一个四足机器人,用于促进敏捷的腿式移动任务学习。这些模块化机器人易于维护且足够坚固,能够承受从零开始的硬件强化学习,目前已记录超过14000小时的训练时间。ROBEL提供了一系列连续控制基准任务,这些任务具有密集和稀疏的任务目标,并引入了硬件安全评分指标。数据集和相关材料可在www.roboticsbenchmarks.org访问,旨在解决强化学习在真实机器人上的应用问题,特别是在处理物理限制和环境交互方面的挑战。

arXiv 收录

Wind Turbine Data

该数据集包含风力涡轮机的运行数据,包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态,适用于风能研究和风力发电系统的优化分析。

www.kaggle.com 收录

OpenSonarDatasets

OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。

github 收录

中文《诗歌总集》

这是一个收录所有中文诗词的数据集,旨在提供一个系统、完善、高质量的诗词数据集合。数据集包括诗词的收录、校正、鉴赏和评分,并标准化为统一的JSON格式。

github 收录

THUCNews

THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。

github 收录