five

Voxel51/VisDrone2019-DET|无人机视觉数据集|目标检测数据集

收藏
hugging_face2024-05-03 更新2024-06-12 收录
无人机视觉
目标检测
下载链接:
https://hf-mirror.com/datasets/Voxel51/VisDrone2019-DET
下载链接
链接失效反馈
资源简介:
VisDrone2019-DET数据集是一个由天津大学机器学习和数据挖掘实验室AISKYEYE团队创建的对象检测数据集,包含8629个样本。该数据集专为无人机图像和视频分析设计,涵盖了训练、验证和测试三个分割。数据集使用CC-BY-SA-3.0许可证,主要语言为英语。此外,数据集还提供了与FiftyOne平台相关的安装和使用指南。
提供机构:
Voxel51
原始信息汇总

数据集概述

名称: VisDrone2019-DET
样本数量: 8629
语言: 英语
许可证: cc-by-sa-3.0
任务类别: 目标检测
媒体类型: 图像
数据集创建者: AISKYEYE团队,天津大学机器学习和数据挖掘实验室
数据集来源:

数据集结构

  • 样本字段:

    • id: fiftyone.core.fields.ObjectIdField
    • filepath: fiftyone.core.fields.StringField
    • tags: fiftyone.core.fields.ListField(fiftyone.core.fields.StringField)
    • metadata: fiftyone.core.fields.EmbeddedDocumentField(fiftyone.core.metadata.ImageMetadata)
    • ground_truth: fiftyone.core.fields.EmbeddedDocumentField(fiftyone.core.labels.Detections)
  • 数据集分割: 训练集、验证集、测试集

数据集创建

  • 源数据生产者: AISKYEYE团队,天津大学机器学习和数据挖掘实验室
  • 个人和敏感信息: 数据集作者已尽力排除可识别信息以保护隐私。如发现个人或车辆信息,请联系作者进行移除。

引用信息

bibtex @ARTICLE{9573394, author={Zhu, Pengfei and Wen, Longyin and Du, Dawei and Bian, Xiao and Fan, Heng and Hu, Qinghua and Ling, Haibin}, journal={IEEE Transactions on Pattern Analysis and Machine Intelligence}, title={Detection and Tracking Meet Drones Challenge}, year={2021}, volume={}, number={}, pages={1-1}, doi={10.1109/TPAMI.2021.3119563}}

版权信息

  • 版权所有者: AISKYEYE团队,天津大学机器学习和数据挖掘实验室
  • 许可证详情: 创意共享署名-非商业性使用-相同方式共享3.0许可证

以上信息基于提供的数据集详情页面README文件内容整理。

AI搜集汇总
数据集介绍
main_image_url
构建方式
VisDrone2019-DET数据集由AISKYEYE团队在天津大学机器学习与数据挖掘实验室精心构建,包含8629个样本。该数据集通过无人机拍摄的图像进行标注,涵盖了多种计算机视觉任务,如目标检测。数据集分为训练、验证和测试三个部分,每个样本均附有详细的标注信息,确保了数据的高质量和实用性。
特点
VisDrone2019-DET数据集的主要特点在于其大规模和高精度。数据集包含8629张图像,每张图像均经过精细标注,适用于目标检测任务。此外,数据集的多样性和复杂性使其成为评估和训练计算机视觉模型的理想选择。数据集还遵循CC BY-SA 3.0许可协议,确保了使用的灵活性和合法性。
使用方法
使用VisDrone2019-DET数据集,首先需要安装FiftyOne库,通过以下命令进行安装:`pip install -U fiftyone`。随后,可以使用Python代码加载数据集,例如:`dataset = fouh.load_from_hub("Voxel51/VisDrone2019-DET")`。加载后,可以通过FiftyOne的应用程序界面进行数据集的可视化和分析,进一步支持目标检测模型的训练和评估。
背景与挑战
背景概述
VisDrone2019-DET数据集由天津大学机器学习与数据挖掘实验室的AISKYEYE团队创建,旨在为无人机图像分析中的目标检测任务提供一个大规模的基准。该数据集包含8629个样本,涵盖了多种复杂的场景和目标类型,为计算机视觉领域的研究提供了丰富的资源。其核心研究问题是如何在无人机视角下准确地检测和识别目标,这对于无人机在实际应用中的导航、监控和搜索救援等任务至关重要。该数据集的发布不仅推动了目标检测技术的发展,也为相关领域的研究提供了宝贵的数据支持。
当前挑战
VisDrone2019-DET数据集在构建过程中面临了多重挑战。首先,无人机视角下的图像具有高度的动态性和复杂性,导致目标检测的难度增加。其次,数据集的标注工作需要高精度的标注,以确保训练模型的准确性。此外,数据集中可能包含敏感信息,如车辆和个人身份,需要进行严格的隐私保护措施。这些挑战不仅影响了数据集的质量,也对后续的研究和应用提出了更高的要求。
常用场景
经典使用场景
在计算机视觉领域,Voxel51/VisDrone2019-DET数据集以其丰富的无人机视角图像和精确的对象检测标注而著称。该数据集的经典使用场景主要集中在无人机图像中的目标检测任务,研究人员利用这些标注数据训练和评估各种深度学习模型,以提高无人机在复杂环境中的目标识别能力。
解决学术问题
Voxel51/VisDrone2019-DET数据集解决了无人机视角下目标检测的学术研究问题。通过提供高质量的标注数据,该数据集帮助研究人员克服了无人机图像中常见的遮挡、光照变化和视角多样性等挑战,推动了目标检测算法在实际应用中的性能提升。
衍生相关工作
基于Voxel51/VisDrone2019-DET数据集,许多相关工作得以展开,包括但不限于改进的目标检测算法、多目标跟踪技术以及无人机图像的实时处理系统。这些研究不仅提升了无人机在复杂环境中的感知能力,还为相关领域的技术进步提供了坚实的基础。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

flames-and-smoke-datasets

该仓库总结了多个公开的火焰和烟雾数据集,包括DFS、D-Fire dataset、FASDD、FLAME、BoWFire、VisiFire、fire-smoke-detect-yolov4、Forest Fire等数据集。每个数据集都有详细的描述,包括数据来源、图像数量、标注信息等。

github 收录

RAVDESS

情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。

OpenDataLab 收录

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

NIST Thermochemical Database

NIST Thermochemical Database(NIST热化学数据库)是一个包含大量热化学数据的数据集,涵盖了各种化学物质的热力学性质,如焓、熵、自由能等。该数据库由美国国家标准与技术研究院(NIST)维护,旨在为科学研究和工业应用提供准确的热化学数据。

webbook.nist.gov 收录

STKit

STKit是一个旨在增强视觉语言模型(VLMs)在动态视频中进行时空推理能力的数据集,包含现实世界视频的3D注释,详细描述了对象的运动动力学,如旅行距离、速度、移动方向等。该数据集通过结合标注数据和伪标签数据,支持LLaVA-OneVision模型的微调,以生成具备时空推理能力的ST-VLM模型。

arXiv 收录