Voxel51/VisDrone2019-DET|无人机视觉数据集|目标检测数据集
收藏数据集概述
名称: VisDrone2019-DET
样本数量: 8629
语言: 英语
许可证: cc-by-sa-3.0
任务类别: 目标检测
媒体类型: 图像
数据集创建者: AISKYEYE团队,天津大学机器学习和数据挖掘实验室
数据集来源:
- 仓库: https://github.com/VisDrone/VisDrone-Dataset
- 论文: Detection and Tracking Meet Drones Challenge
数据集结构
-
样本字段:
- id: fiftyone.core.fields.ObjectIdField
- filepath: fiftyone.core.fields.StringField
- tags: fiftyone.core.fields.ListField(fiftyone.core.fields.StringField)
- metadata: fiftyone.core.fields.EmbeddedDocumentField(fiftyone.core.metadata.ImageMetadata)
- ground_truth: fiftyone.core.fields.EmbeddedDocumentField(fiftyone.core.labels.Detections)
-
数据集分割: 训练集、验证集、测试集
数据集创建
- 源数据生产者: AISKYEYE团队,天津大学机器学习和数据挖掘实验室
- 个人和敏感信息: 数据集作者已尽力排除可识别信息以保护隐私。如发现个人或车辆信息,请联系作者进行移除。
引用信息
bibtex @ARTICLE{9573394, author={Zhu, Pengfei and Wen, Longyin and Du, Dawei and Bian, Xiao and Fan, Heng and Hu, Qinghua and Ling, Haibin}, journal={IEEE Transactions on Pattern Analysis and Machine Intelligence}, title={Detection and Tracking Meet Drones Challenge}, year={2021}, volume={}, number={}, pages={1-1}, doi={10.1109/TPAMI.2021.3119563}}
版权信息
- 版权所有者: AISKYEYE团队,天津大学机器学习和数据挖掘实验室
- 许可证详情: 创意共享署名-非商业性使用-相同方式共享3.0许可证
以上信息基于提供的数据集详情页面README文件内容整理。

flames-and-smoke-datasets
该仓库总结了多个公开的火焰和烟雾数据集,包括DFS、D-Fire dataset、FASDD、FLAME、BoWFire、VisiFire、fire-smoke-detect-yolov4、Forest Fire等数据集。每个数据集都有详细的描述,包括数据来源、图像数量、标注信息等。
github 收录
RAVDESS
情感语音和歌曲 (RAVDESS) 的Ryerson视听数据库包含7,356个文件 (总大小: 24.8 GB)。该数据库包含24位专业演员 (12位女性,12位男性),以中性的北美口音发声两个词汇匹配的陈述。言语包括平静、快乐、悲伤、愤怒、恐惧、惊讶和厌恶的表情,歌曲则包含平静、快乐、悲伤、愤怒和恐惧的情绪。每个表达都是在两个情绪强度水平 (正常,强烈) 下产生的,另外还有一个中性表达。所有条件都有三种模态格式: 纯音频 (16位,48kHz .wav),音频-视频 (720p H.264,AAC 48kHz,.mp4) 和仅视频 (无声音)。注意,Actor_18没有歌曲文件。
OpenDataLab 收录
学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
NIST Thermochemical Database
NIST Thermochemical Database(NIST热化学数据库)是一个包含大量热化学数据的数据集,涵盖了各种化学物质的热力学性质,如焓、熵、自由能等。该数据库由美国国家标准与技术研究院(NIST)维护,旨在为科学研究和工业应用提供准确的热化学数据。
webbook.nist.gov 收录
STKit
STKit是一个旨在增强视觉语言模型(VLMs)在动态视频中进行时空推理能力的数据集,包含现实世界视频的3D注释,详细描述了对象的运动动力学,如旅行距离、速度、移动方向等。该数据集通过结合标注数据和伪标签数据,支持LLaVA-OneVision模型的微调,以生成具备时空推理能力的ST-VLM模型。
arXiv 收录
