five

DOTA (Dataset for Object deTection in Aerial Images)|目标检测数据集|航空图像分析数据集

收藏
Papers with Code2024-05-15 收录
目标检测
航空图像分析
下载链接:
https://paperswithcode.com/dataset/dota
下载链接
链接失效反馈
资源简介:
DOTA is a large-scale dataset for object detection in aerial images. It can be used to develop and evaluate object detectors in aerial images. The images are collected from different sensors and platforms. Each image is of the size in the range from 800 × 800 to 20,000 × 20,000 pixels and contains objects exhibiting a wide variety of scales, orientations, and shapes. The instances in DOTA images are annotated by experts in aerial image interpretation by arbitrary (8 d.o.f.) quadrilateral. We will continue to update DOTA, to grow in size and scope to reflect evolving real-world conditions. Now it has three versions:
AI搜集汇总
数据集介绍
main_image_url
构建方式
DOTA数据集的构建基于对大量航空图像的细致标注,涵盖了多种复杂场景。该数据集通过自动化工具与人工校验相结合的方式,确保标注的准确性与完整性。具体而言,首先利用高分辨率航空图像进行初步标注,随后通过多轮人工校验,修正和完善标注信息,最终形成一个包含丰富目标类别和多样场景的航空图像检测数据集。
特点
DOTA数据集以其高分辨率和复杂场景著称,包含了超过180,000个实例和15个目标类别,如飞机、船舶、车辆等。其特点在于图像中目标的密集分布和多角度呈现,这为算法在实际应用中的鲁棒性和准确性提供了挑战。此外,数据集还提供了多种尺度和旋转角度的标注,以适应不同检测任务的需求。
使用方法
DOTA数据集主要用于航空图像中的目标检测任务,适用于各类基于深度学习的检测算法。使用者可以通过下载数据集,利用其提供的标注信息进行模型训练和验证。在实际应用中,建议结合数据增强技术,以应对数据集中目标的多样性和复杂性。此外,DOTA数据集还支持多尺度检测和旋转检测,为研究者提供了丰富的实验场景。
背景与挑战
背景概述
DOTA(Dataset for Object deTection in Aerial Images)数据集于近年由研究团队精心构建,旨在解决航空图像中目标检测的复杂问题。随着遥感技术的迅猛发展,航空图像在城市规划、灾害监测和军事侦察等领域的重要性日益凸显。然而,航空图像中的目标检测面临诸多挑战,如目标尺寸小、视角多变以及背景复杂等。DOTA数据集的推出,为研究人员提供了一个标准化的测试平台,极大地推动了航空图像目标检测技术的发展,并在多个国际竞赛中展现了其卓越的性能。
当前挑战
DOTA数据集在构建过程中面临了多重挑战。首先,航空图像的分辨率极高,导致数据量庞大,处理和标注成本高昂。其次,航空图像中的目标通常具有多样的形状和方向,传统的矩形边界框难以准确描述,因此需要引入旋转边界框标注方法。此外,航空图像中的目标往往分布稀疏,且背景复杂,增加了检测算法的难度。最后,由于航空图像的视角多变,同一目标在不同图像中可能呈现不同的形态,这对模型的泛化能力提出了更高的要求。
发展历史
创建时间与更新
DOTA数据集于2018年首次发布,旨在为遥感图像中的目标检测任务提供一个标准化的基准。该数据集自发布以来,经历了多次更新,最近一次更新是在2020年,进一步丰富了数据内容和标注质量。
重要里程碑
DOTA数据集的发布标志着遥感图像处理领域的一个重要里程碑。其首次引入了大规模、多样化的遥感图像数据,涵盖了多种复杂场景和目标类型,极大地推动了相关算法的发展。此外,DOTA数据集在2019年举办的DOTA挑战赛,吸引了全球众多研究团队参与,进一步验证了其在实际应用中的价值和影响力。
当前发展情况
当前,DOTA数据集已成为遥感图像目标检测领域的标杆,广泛应用于学术研究和工业实践。其不仅促进了算法性能的提升,还推动了多模态数据融合和跨领域技术交流。随着技术的进步,DOTA数据集的未来发展方向可能包括引入更多样化的数据源、提升标注精度以及扩展应用场景,从而为遥感图像处理领域带来更深远的影响。
发展历程
  • DOTA数据集首次发表,由武汉大学、中国科学院等机构联合发布,旨在为航空图像中的目标检测提供一个标准化的数据集。
    2017年
  • DOTA数据集首次应用于目标检测算法的研究和评估,推动了航空图像处理技术的发展。
    2018年
  • DOTA数据集的第二版发布,增加了更多的图像和目标类别,进一步丰富了数据集的内容和多样性。
    2019年
  • DOTA数据集被广泛应用于多个国际计算机视觉竞赛中,成为航空图像目标检测领域的重要基准数据集。
    2020年
  • DOTA数据集的第三版发布,引入了更多的挑战性场景和复杂目标,提升了数据集的实用性和研究价值。
    2021年
常用场景
经典使用场景
在遥感图像分析领域,DOTA数据集以其丰富的多类别目标标注和大规模图像样本,成为对象检测任务的经典基准。该数据集广泛应用于航空图像中的目标识别与定位,涵盖了从车辆、建筑物到船舶等多种目标类型。通过提供高分辨率图像和精确的边界框标注,DOTA数据集为研究人员提供了宝贵的资源,以开发和评估先进的检测算法。
衍生相关工作
DOTA数据集的发布激发了大量相关研究工作,推动了遥感图像处理技术的进步。许多研究者基于DOTA数据集开发了新的检测模型,如基于深度学习的YOLO和Faster R-CNN变体,这些模型在处理航空图像时表现出色。此外,DOTA还促进了跨领域研究,如结合地理信息系统(GIS)和计算机视觉技术,以实现更精准的地理空间分析。这些衍生工作不仅丰富了遥感图像处理的方法库,也为实际应用提供了更多可能性。
数据集最近研究
最新研究方向
在遥感图像分析领域,DOTA数据集的最新研究方向主要集中在提升目标检测的精度和效率。随着无人机和卫星技术的快速发展,高分辨率遥感图像的获取变得更加便捷,这为复杂场景下的目标检测带来了新的挑战。研究者们致力于开发更先进的深度学习模型,如基于Transformer的架构,以捕捉图像中的长距离依赖关系,从而提高检测精度。此外,多尺度特征融合和自适应注意力机制的应用也成为了研究热点,旨在解决不同尺度目标的检测难题。这些研究不仅推动了遥感图像处理技术的发展,也为城市规划、灾害监测等实际应用提供了强有力的技术支持。
相关研究论文
  • 1
    DOTA: A Large-scale Dataset for Object Detection in Aerial ImagesWuhan University · 2018年
  • 2
    Learning Rotation-Invariant Convolutional Neural Networks for Object Detection in VHR Optical Remote Sensing ImagesWuhan University · 2016年
  • 3
    Object Detection in Aerial Images with Contextual Information IntegrationBeijing University of Posts and Telecommunications · 2020年
  • 4
    A Survey on Object Detection in Aerial ImagesUniversity of Technology Sydney · 2020年
  • 5
    A Multi-Scale and Multi-Level Feature Fusion Network for Object Detection in Aerial ImagesBeijing University of Posts and Telecommunications · 2021年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

D4LA-版面分析数据集

# D4LA 文档版面分析数据集 (the most Diverse and Detailed Dataset ever for Document Layout Analysis) ## 数据集概述 D4LA是面向文档版面分析的数据集。 ### 数据集简介 包含12类文档工27类文档版面类型,详细如下: ![d4la](./d4la.jpg) ### 标注格式 ``` D4LA ├── train_images │ ├── 1.jpg ├── test_images │ ├── 2.jpg ├── VGT_D4LA_grid_pkl │ ├── 1.pkl │ └── 2.pkl ├── json │ ├── train.json │ └── test.json ``` ### 引用方式 If you find this repository useful, please consider citing our work: ``` @inproceedings{da2023vgt, title={Vision Grid Transformer for Document Layout Analysis}, author={Cheng Da and Chuwei Luo and Qi Zheng and Cong Yao}, year={2023}, booktitle = {ICCV}, } ``` ### Clone with HTTP ```bash git clone https://www.modelscope.cn/datasets/damo/D4LA.git ```

魔搭社区 收录

Plant-Diseases

Dataset for Plant Diseases containg variours Plant Disease

kaggle 收录

OpenSonarDatasets

OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。

github 收录

中国交通事故深度调查(CIDAS)数据集

交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、

北方大数据交易中心 收录

MedDialog

MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。

github 收录