FAST-FREX|天文学数据集|射电天文学数据集
收藏RaSPDAM 数据集概述
数据集介绍
RaSPDAM 是一个基于视觉形态特征的机器学习算法,专门用于快速射电暴(FRB)的检测。该算法旨在解决传统FRB搜索方法在计算和时间上的挑战,提供显著的效率和准确性改进。
数据集背景
快速射电暴(FRB)是从遥远星系发出的短暂而强烈的射电能量脉冲。它们的发现和研究对于理解宇宙中物质的分布和演化至关重要。然而,由于射电望远镜产生的大量数据和现有搜索方法的计算复杂性,FRB的检测是一项具有挑战性的任务。传统技术在检测弱信号方面往往表现不佳,且耗时较长。
数据集内容
RaSPDAM的测试基于FAST-FREX数据集,该数据集建立在五百米口径球面射电望远镜(FAST)的观测基础上。数据集包含:
- 600个正样本:来自三个源(FRB20121102、FRB20180301和FRB20201124)的观测FRB信号。
- 1000个负样本:噪声和射频干扰(RFI)。
关键特性
效率和准确性
- 高精度:RaSPDAM的精度达到98.73%,显著优于传统方法如PRESTO和Heimdall。
- 高召回率:召回率为77.67%,有效识别出大部分真实的FRB信号。
- F1分数:F1分数为0.8694,表明在精度和召回率之间取得了良好的平衡。
多功能性
- 目前RaSPDAM提供到达时间(ToA)作为结果,未来的增强将包括色散量(DM),以进行更全面的信号验证。
性能基准
与传统方法的比较:
软件 | TN | TP | FN | FP | 召回率 | 精度 | F1分数 |
---|---|---|---|---|---|---|---|
PRESTO | 3 | 472 | 0 | 26963700 | 0.7867 | 1.7505E-05 | 3.5009E-05 |
Heimdall | 218 | 489 | 36 | 5854 | 0.8150 | 0.0771 | 0.1409 |
RaSPDAM | 989 | 466 | 128 | 6 | 0.7767 | 0.9873 | 0.8694 |
发现
自部署以来,RaSPDAM在识别以下方面发挥了重要作用:
- 2个新的FRB:FRB20211103A和FRB20230104。
- 80个脉冲星:包括13个先前未发现的脉冲星,突显了该算法在发现新天体方面的有效性。

HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
中国裁判文书网
中国裁判文书网是中国最高人民法院设立的官方网站,旨在公开各级法院的裁判文书。该数据集包含了大量的法律文书,如判决书、裁定书、调解书等,涵盖了民事、刑事、行政、知识产权等多个法律领域。
wenshu.court.gov.cn 收录
VoxBox
VoxBox是一个大规模语音语料库,由多样化的开源数据集构建而成,用于训练文本到语音(TTS)系统。
github 收录
LinkedIn Salary Insights Dataset
LinkedIn Salary Insights Dataset 提供了全球范围内的薪资数据,包括不同职位、行业、地理位置和经验水平的薪资信息。该数据集旨在帮助用户了解薪资趋势和市场行情,支持职业规划和薪资谈判。
www.linkedin.com 收录
MineNetCD
MineNetCD数据集由慕尼黑工业大学等机构创建,是一个全球矿区变化检测的综合基准数据集。该数据集包含超过70k对的双时相高分辨率遥感图像,覆盖全球100个矿区,总面积约6756.88平方公里。数据集的创建过程结合了半自动标注和专家手动标注,确保了数据的精细度和准确性。MineNetCD数据集主要应用于矿区环境监测和可持续发展研究,旨在通过高精度的变化检测技术,帮助实现矿区的可持续管理和环境保护。
arXiv 收录