five

FireFly|森林火灾检测数据集|机器学习数据集

收藏
arXiv2023-08-07 更新2024-06-21 收录
森林火灾检测
机器学习
下载链接:
https://github.com/ERGOWHO/Firefly2.0.git
下载链接
链接失效反馈
资源简介:
FireFly数据集是由南加州大学创建的合成数据集,用于检测森林火灾中的余烬。该数据集包含19,273张图像,涵盖了多种环境条件,如天气、光照和大气能见度。数据集的创建过程涉及使用虚幻引擎4(UE4)自动生成带有可调参数的标签数据,以增加数据的多样性和定制性。FireFly数据集主要应用于提高机器学习模型在真实世界森林火灾场景中的检测精度,特别是在减少误报和漏报方面。
提供机构:
南加州大学
创建时间:
2023-08-07
AI搜集汇总
数据集介绍
main_image_url
构建方式
FireFly数据集通过使用Unreal Engine 4(UE4)创建,旨在克服当前缺乏专门用于灰烬检测的训练资源的挑战。该数据集的构建工具允许自动生成带有可调参数的合成标记数据集,从而在各种环境条件下实现数据多样性。具体而言,数据集包括两种不同的森林类型(密集针叶林和枯木森林),并通过调整天气、光照和雾等参数来创建多样化的环境。此外,使用UE4的Niagara粒子系统生成灰烬数据,并通过蓝图和C++脚本定义其三维坐标、大小和粒子数量,最终生成2D边界框作为地面真值。
特点
FireFly数据集具有显著的多样性和可定制性,包含19,273帧图像,涵盖了从燃烧的叶子到火花等多种灰烬类型,以及不同的环境条件如天气、光照和大气可见度。数据集分为正样本(包含灰烬)和负样本(不包含灰烬),其中正样本数量远多于负样本,以提高模型在减少假阴性方面的性能。此外,数据集的多样性通过调整森林类型、灰烬类型、季节、背景和相机角度等参数得以增强,从而丰富了数据集的变异性。
使用方法
FireFly数据集主要用于训练和评估灰烬检测模型。研究者可以使用该数据集来训练各种主流的对象检测模型,如Sparse R-CNN、RetinaNet、DETR和YOLOv7,并通过调整参数来优化模型性能。数据集还支持半自动标注流程,通过训练模型对真实世界中的灰烬帧进行自动标注,从而减少人工干预。此外,数据集的多样性和高分辨率特性使其适用于评估模型在极端测试条件下的表现,并能够推广到真实世界的森林火灾场景中。
背景与挑战
背景概述
近年来,全球范围内频繁发生的极端野火事件,如2023年加拿大野火,已引起广泛关注。特别是加利福尼亚州,作为野火频发地区,其2023年3月20日前的数据显示,已有408起火灾烧毁了131英亩土地。野火的破坏力不仅限于其直接的热辐射,还包括由火前线产生的空中碎片,即灰烬或火种,这些物质能够造成重大损害,甚至超过野火本身的影响。研究表明,灰烬在野地城市交界处的野火中扮演了重要角色,能够远距离传播,增加了预测其轨迹的难度。为了应对这一挑战,FireFly数据集应运而生,由南加州大学等机构的研究人员于2023年创建,旨在通过使用虚幻引擎4(UE4)生成合成数据,解决当前缺乏专门用于灰烬检测的训练资源的问题。该数据集包含19,273帧图像,涵盖了多种环境条件,为开发更有效的野火响应系统提供了基础。
当前挑战
FireFly数据集在构建过程中面临多项挑战。首先,收集真实世界中的野火数据存在显著风险,且难以捕捉到灰烬可能出现的多样环境。其次,手动标注真实实验视频的过程极其耗时。为解决这些问题,研究团队开发了一种工具,允许自动生成带有可调参数的合成标注数据集,从而实现数据多样性。此外,尽管合成数据集在多样性和可定制性方面具有优势,但其与真实数据的差异仍是一个挑战,特别是在模型泛化到真实世界场景时。实验结果表明,尽管合成数据集在某些情况下表现优异,但在处理极端条件下的密集小目标时,现有模型仍面临分辨率不足和目标信息丢失的问题。因此,如何进一步提高合成数据集的质量,使其更接近真实数据,同时保持其多样性和可扩展性,是未来研究的重要方向。
常用场景
经典使用场景
在森林火灾的背景下,FireFly数据集的经典使用场景主要集中在火源检测和火势蔓延预测。通过模拟不同环境条件下的火源和火势,该数据集为研究人员提供了一个多样化的训练平台,以评估和改进现有的火源检测算法。具体应用包括无人机和监控塔上的实时火源检测系统,以及用于预测火势蔓延的智能响应系统。
衍生相关工作
FireFly数据集的发布催生了一系列相关研究工作,特别是在火源检测和火势预测领域。例如,基于FireFly数据集的训练模型被应用于开发更高效的火源检测算法,如YOLOv7的改进版本。此外,该数据集还促进了半自动标注工具的发展,进一步减少了人工标注的工作量,提高了数据处理的效率。
数据集最近研究
最新研究方向
在应对全球日益严峻的野火问题上,FireFly数据集的出现填补了火烬检测领域的数据空白。该数据集通过虚幻引擎4(UE4)生成,不仅提供了多样化的环境条件和火烬类型,还显著提升了主流目标检测模型在实际野火场景中的表现。最新研究方向集中在利用FireFly数据集优化模型性能,特别是在处理高密度和小尺寸火烬对象时。此外,研究还探索了半自动标注流程,以减少人工干预,提高数据标注效率。这些进展对于开发更有效的野火响应系统具有重要意义,能够显著提升火烬检测的准确性和实时性,从而在实际应用中发挥关键作用。
相关研究论文
  • 1
    FireFly A Synthetic Dataset for Ember Detection in Wildfire南加州大学 · 2023年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国空气质量数据集(2014-2020年)

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心 收录

YOLO Drone Detection Dataset

为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。

github 收录

用于陆面模拟的中国土壤数据集(第二版)

本研究对中国范围内0-2米六个标准深度层(0-5、5-15、15-30、30-60、60-100和100-200厘米)的23种土壤物理和化学属性进行了90米空间分辨率的制图。该数据集源自第二次土壤普查的8979个土壤剖面,世界土壤信息服务的1540个土壤剖面,第一次全国土壤普查的76个土壤剖面,以及区域数据库的614个土壤剖面。该数据集包括pH值、砂粒、粉粒、粘粒、容重、有机碳含量、砾石、碱解氮、总氮、阳离子交换量、孔隙度、总钾、总磷、有效钾、有效磷和土壤颜色(包括蒙赛尔颜色和RGB两种形式)。数据集的缺失值为“fillvalue = -32768”。数据集以栅格格式提供,有Tiff和netCDF两种格式。为了满足陆面建模中不同应用对空间分辨率的不同要求,CSDLv2 提供了 90 米、1 公里和 10公里空间分辨率的版本。各个土壤属性的单位参见说明文档。该数据集相对于第一版具有更好的数据质量,可广泛应用于陆面过程模拟等地学相关研究。

国家青藏高原科学数据中心 收录

URPC系列数据集, S-URPC2019, UDD

URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。

github 收录

Plant-Diseases

Dataset for Plant Diseases containg variours Plant Disease

kaggle 收录