ransomware-dataset|勒索软件数据集|恶意软件分析数据集
收藏Ransomware samples dataset 概述
数据集来源
- 基于 VirusShare 的 33.9M 样本集合。
- 使用 John Seymour 的 dataset,包含 VirusTotal 从 2012 年 6 月至 2019 年 2 月的 33.2M 样本标签。
数据处理
- 下载原始数据集并筛选出所有
ransom
检测结果,得到 456856 个样本。 - 进一步筛选出 Windows 可执行文件,使用 VirusShare 的 filetypes 数据集,排除浏览器相关的 HTML 文件。
- 最终得到 339594 个样本。
样本分类
- 使用 AVClass malware labeling tool 对样本进行家族分类。
- 结果包括 23616 个
SINGLETON
(仅含通用名称的样本),1562 个单一样本家族,以及 1671 个包含 2 个或以上成员的 ransomware 家族。 - 排除
SINGLETON
后,基础样本集为 315978 个。
分布情况
- 呈现典型的长尾分布。
- 2 个样本的家族中包含了一些知名 ransomware,如 GoldenEye, ZeroLocker 和 Bad Rabbit。
- 1 个样本的家族中包含了一些已知的 ransomware,如 Alcatraz Locker。
流行 Ransomware
- 包括 Zeus, Winwebsec, Virlock, ZeroAccess, PornoBlocker 等。

中国裁判文书网
中国裁判文书网是中国最高人民法院设立的官方网站,旨在公开各级法院的裁判文书。该数据集包含了大量的法律文书,如判决书、裁定书、调解书等,涵盖了民事、刑事、行政、知识产权等多个法律领域。
wenshu.court.gov.cn 收录
TCIA
TCIA(The Cancer Imaging Archive)是一个公开的癌症影像数据集,包含多种癌症类型的医学影像数据,如CT、MRI、PET等。这些数据通常与临床和病理信息相结合,用于癌症研究和临床试验。
www.cancerimagingarchive.net 收录
AQA-7
AQA-7 是一个用于动作质量评估(AQA)的统一基准数据集,旨在通过整合多个领域的数据集来标准化评估方法。该数据集包含视频、骨骼数据和多模态输入,涵盖了体育分析、技能评估和医疗护理等多个应用领域。数据集的创建过程通过系统分析现有文献和实验协议,确保了评估的准确性和计算效率。AQA-7 的应用领域广泛,旨在解决动作质量评估中的偏差问题,提供客观的自动化评估,特别是在体育评分、技能评估和康复训练中具有重要意义。
arXiv 收录
中国气象数据
本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。
github 收录
SWaT Dataset
SWaT Dataset是一个用于工业控制系统(ICS)安全研究的数据集,包含了模拟的网络攻击和正常操作的数据。该数据集由新加坡科技设计大学(Singapore University of Technology and Design)发布,旨在帮助研究人员开发和测试用于检测工业控制系统中网络攻击的算法和模型。
itrust.sutd.edu.sg 收录