CADP|交通安全数据集|视频分析数据集

arXiv2018-11-16 更新2024-06-21 收录

交通安全

视频分析

下载链接：

https://goo.gl/cqK2wE

下载链接

链接失效反馈

资源简介：

CADP数据集是由卡内基梅隆大学语言技术研究所和东京大学合作创建的，专注于基于CCTV交通摄像头的事故分析。该数据集包含230个视频，总计1416个事故片段，每个视频至少包含一个从固定交通摄像头捕捉的事故。数据集的创建过程涉及从YouTube视频中收集事故片段，并通过内部和外部注释者进行注释。CADP数据集的应用领域包括时间分割、物体检测、跟踪、车辆碰撞、事故检测和预测，旨在通过提供丰富的时空标注数据，增强道路安全研究和驾驶教育。

提供机构：

卡内基梅隆大学语言技术研究所，美国东京大学，日本

创建时间：

2018-09-16

AI搜集汇总

数据集介绍

构建方式

为了解决道路安全研究中缺乏公开数据的问题，本研究团队提出了一个名为CADP的数据集。该数据集的构建过程首先从YouTube上搜索并筛选出交通事故视频，然后通过内部标注员和外部工作者的共同努力，对视频进行时空标注，包括目标检测、跟踪和碰撞检测。最后，研究团队利用先进的对象检测模型，如Faster R-CNN，并测试了Context Mining和Augmented Context Mining对检测小型目标（如行人）的影响。

特点

CADP数据集具有以下特点：首先，该数据集包含230个视频，每个视频至少包含一个从固定交通摄像头视角拍摄的交通事故，以及1416个交通事故片段。其次，数据集涵盖了各种摄像头类型、质量、天气条件和编辑/重采样视频，体现了现实世界的多样性。此外，数据集中大部分对象为小型物体（<100像素），这对于准确检测小型物体具有重要意义。最后，CADP数据集提供了完整的时空标注，包括碰撞发生和结束的时间。

使用方法

使用CADP数据集时，首先需要对数据集进行下载和准备。然后，可以使用先进的对象检测模型，如Faster R-CNN，对数据进行对象检测。此外，研究团队还提出了一种事故预测框架，结合了Faster R-CNN和Accident LSTM架构，可以对交通事故进行预测。在使用过程中，可以结合Context Mining和Augmented Context Mining技术，以进一步提高小型目标检测的准确性。最后，研究者可以通过评估指标，如Time-to-Accident（ToA）和Average Precision（AP），来评估模型在预测交通事故方面的性能。

背景与挑战

背景概述

随着智能城市和自动驾驶概念的兴起，交通安全监控成为了计算机视觉技术的重要应用领域。本文介绍了一个名为CADP的新数据集，该数据集旨在解决道路上自动时空标注的交通安全研究缺乏公共数据的问题。CADP数据集由卡内基梅隆大学语言技术研究所和东京大学的联合研究团队创建，主要研究人员包括Ankit Parag Shah、Jean-Bapstite Lamare、Tuan Nguyen-Anh和Alexander Hauptmann。该数据集的创建旨在通过分析交通摄像头视角下的交通事故，为交通事故的学习和预测提供一个新的视角，从而推动驾驶教育和道路安全研究的进步。CADP数据集包含了230个视频，每个视频至少包含一次从固定交通摄像头视角拍摄的交通事故，以及1416个交通事故的片段。此外，该数据集还包含了205个高清视频片段，用于标注时空数据以进行目标检测、跟踪和碰撞检测。CADP数据集的发布为相关领域的研究提供了宝贵的数据资源，对于提高交通事故检测和预测的准确性具有重要意义。

当前挑战

CADP数据集在构建过程中面临了多个挑战。首先，交通事故作为稀有事件，难以通过记录道路交叉口的实时视频来获取足够的数据。其次，获取交通摄像头数据的法律途径在实际操作中存在困难。为了解决这些挑战，研究团队采用了从YouTube上收集交通事故视频的策略，并通过内部标注人员和外部工作人员的共同努力完成了数据集的标注工作。此外，由于数据集中小尺寸物体（如行人）的检测准确率较低，研究团队提出了将上下文信息整合到传统的Faster R-CNN中，使用上下文挖掘（CM）和增强上下文挖掘（ACM）方法来提高小尺寸物体的检测精度。实验结果表明，CM和ACM方法在目标检测精度上取得了显著的提升。然而，这些方法的实现需要更多的计算资源和时间，因此在实际应用中需要权衡精度和效率。最后，由于CADP数据集中缺乏明确的负面事件，研究团队采取了从正面序列中挖掘负面样本的策略，以解决训练过程中的不平衡问题。这些挑战和解决方案的探索为交通事故检测和预测领域的研究提供了重要的经验和启示。

常用场景

经典使用场景

在交通监控领域，CADP数据集的经典使用场景包括对象检测、跟踪、碰撞检测、事故检测和预测等。通过分析该数据集，研究人员可以观察到在行人类别中，由于对象尺寸和场景复杂性，目标检测的显著下降。为了解决这个问题，我们提出将上下文信息集成到传统的Faster R-CNN中，使用Context Mining (CM)和Augmented Context Mining (ACM)来补充小行人检测的准确性。我们的实验表明，目标检测精度有了显著提高：CM提高了8.51%，ACM提高了6.20%。最后，我们使用Faster R-CNN和Accident LSTM架构展示了我们在数据集中进行事故预测的性能。在事故发生的时间测量方面，我们实现了1.684秒的平均时间，平均精确度为47.25%。

解决学术问题

CADP数据集解决了交通监控中缺乏公开数据的问题，这些数据用于研究道路安全自动时空标注。该数据集提供了独特的视角，帮助研究人员更好地理解交通事故，并为提高道路安全做出贡献。通过应用先进的对象检测模型和事故预测模型，该数据集为交通监控领域的研究提供了新的思路和方法。

衍生相关工作

基于CADP数据集的研究衍生出了许多相关的工作，例如使用Context Mining和Augmented Context Mining来提高小目标检测的准确性，以及使用Accident LSTM架构进行事故预测。这些工作不仅提高了交通监控系统的性能，还为自动驾驶汽车的开发提供了新的思路和方法。

以上内容由AI搜集并总结生成

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4098个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

YOLO Drone Detection Dataset

为了促进无人机检测模型的开发和评估，我们引入了一个新颖且全面的数据集，专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集，包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象，以实现强大的检测和分类。

github 收录

OpenSonarDatasets

OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库，旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合，以增加开放源代码声纳数据集的可见性，并提供一个更容易查找和比较数据集的方式。

github 收录

FAOSTAT Agricultural Data

FAOSTAT Agricultural Data 是由联合国粮食及农业组织（FAO）提供的全球农业数据集。该数据集涵盖了农业生产、贸易、价格、土地利用、水资源、气候变化、人口统计等多个方面的详细信息。数据包括了全球各个国家和地区的农业统计数据，旨在为政策制定者、研究人员和公众提供全面的农业信息。

www.fao.org 收录

MedDialog

MedDialog数据集（中文）包含了医生和患者之间的对话（中文）。它有110万个对话和400万个话语。数据还在不断增长，会有更多的对话加入。原始对话来自好大夫网。

github 收录

PlantVillage Dataset

该数据集包含约54,305张植物叶子的图像，这些图像在受控环境下收集，涵盖14种不同的植物种类。数据集包含38种植物疾病类别和1种背景图像。

github 收录