five

涉赌涉诈资金交易流水数据集|反欺诈数据集|金融风险管理数据集

收藏
github2023-03-25 更新2024-05-31 收录
反欺诈
金融风险管理
下载链接:
https://github.com/ZongXR/DCIC2023-Fraud-Risk-Identification
下载链接
链接失效反馈
资源简介:
本数据集包含涉赌涉诈黑名单、白名单及用于训练的相关交易流水数据,旨在帮助构建涉赌涉诈账户算法识别模型,全面排查存量风险。

This dataset comprises blacklists and whitelists related to gambling and fraud, along with associated transaction flow data for training purposes. It is designed to assist in the development of algorithmic models for identifying accounts involved in gambling and fraud, facilitating a comprehensive examination of existing risks.
创建时间:
2023-02-09
AI搜集汇总
数据集介绍
main_image_url
构建方式
涉赌涉诈资金交易流水数据集的构建依托于兴业银行股份有限公司提供的真实交易数据,结合黑名单和白名单的标注信息,形成了包含涉赌涉诈账户及其相关交易流水的训练数据集。数据集的构建过程严格遵循金融监管要求,确保数据的真实性和有效性,同时通过匿名化处理保护用户隐私。数据集涵盖了跨境赌博、电信网络诈骗等多种欺诈行为的资金流动特征,为反欺诈模型的开发提供了坚实的基础。
使用方法
该数据集主要用于训练和优化涉赌涉诈账户识别模型。用户可以通过分析交易流水数据,提取资金流动的特征,结合黑名单和白名单的标注信息,构建分类模型。数据集的使用需遵循竞赛规则,仅用于模型训练和科研目的,不得用于商业用途。用户可通过竞赛平台提交模型作品,参与实时评测和定时评测,最终通过专家评审确定模型的有效性和实用性。
背景与挑战
背景概述
涉赌涉诈资金交易流水数据集由兴业银行股份有限公司于2023年推出,旨在应对跨境赌博、电信网络诈骗等外部欺诈行为的日益严峻形势。该数据集的创建背景源于国家层面对反欺诈治理工作的高度重视,特别是在《中华人民共和国反电信网络诈骗法》正式施行后,银行业金融机构被要求开发和运用有效的金融科技和大数据系统,以识别和监测异常账户和可疑交易。该数据集的核心研究问题是通过分析涉赌涉诈资金交易的新方式,优化风险监测模型,从而提升金融机构的反欺诈能力。该数据集不仅为金融科技领域提供了重要的研究资源,也为反欺诈技术的进步和实际应用奠定了坚实基础。
当前挑战
涉赌涉诈资金交易流水数据集在解决欺诈风险识别问题时面临多重挑战。首先,欺诈行为的多样性和隐蔽性使得识别异常交易变得极为复杂,传统的规则引擎和简单的统计方法难以应对不断变化的欺诈手段。其次,数据集的构建过程中,如何确保数据的真实性和代表性是一大难题,尤其是在涉及敏感金融数据时,隐私保护和数据安全的要求极高。此外,模型的泛化能力也是一个关键挑战,由于欺诈行为具有高度的动态性和地域性,模型在不同场景下的表现可能存在显著差异。最后,如何在保证模型准确性的同时,降低误报率,避免对正常用户造成不必要的干扰,也是该领域亟待解决的问题。
常用场景
经典使用场景
在金融科技领域,涉赌涉诈资金交易流水数据集被广泛应用于欺诈风险识别模型的训练与优化。通过分析大量的交易流水数据,研究人员能够构建出高效的算法模型,用于识别和预测潜在的欺诈行为。这一数据集的使用不仅提升了模型的准确性,还为金融机构提供了强有力的技术支持,以应对日益复杂的欺诈手段。
解决学术问题
该数据集有效解决了金融欺诈检测中的关键问题,如如何从海量交易数据中识别出异常模式、如何提高模型的泛化能力以及如何应对欺诈手段的不断演变。通过提供真实且多样化的交易数据,研究人员能够深入探讨欺诈行为的特征,并开发出更为精准的检测算法,从而在学术研究中取得突破性进展。
实际应用
在实际应用中,涉赌涉诈资金交易流水数据集被广泛应用于银行、支付平台等金融机构的欺诈检测系统中。通过实时监控交易流水,系统能够快速识别出可疑交易,并及时采取风险控制措施,从而有效减少欺诈行为的发生。这不仅保护了用户的财产安全,也提升了金融机构的风险管理能力。
数据集最近研究
最新研究方向
在金融科技领域,涉赌涉诈资金交易流水数据集的研究方向主要集中在欺诈风险识别模型的优化与创新。随着跨境赌博和电信网络诈骗的日益猖獗,传统的风险监测手段已难以应对复杂多变的欺诈行为。因此,研究者们正致力于利用机器学习和大数据技术,深入分析交易流水中的异常模式,构建更为精准的识别模型。这一研究方向不仅有助于提升金融机构的风险防控能力,还能为监管机构提供有力的技术支持,推动反欺诈工作的法制化和规范化进程。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国农村金融统计数据

该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。

www.pbc.gov.cn 收录

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

中国250米灌溉耕地分布数据集(2000-2020)

灌溉耕地分布是开展生态、水文和气候研究的关键数据,并在水土资源管理中具有特别重要的地位。通过半自动机器学习模型,融合多源遥感数据(包括耕地分布、植被指数、水稻田分布)、灌溉统计和调查数据,以及灌溉适宜性分析,生成了中国逐年、250米灌溉耕地分布图(CIrrMap250)。利用2万个参考样本和高分辨率灌溉取水数据,对灌溉耕地分布数据的精度进行评估。结果显示,CIrrMap250在2000年、2010年和2020年的总体精度为0.79-0.88,优于现有的同类产品。

国家青藏高原科学数据中心 收录

中国陆域及周边逐日1km全天候地表温度数据集(TRIMS LST;2000-2023)

地表温度(Land surface temperature, LST)是地球表面与大气之间界面的重要参量之一。它既是地表与大气能量交互作用的直接体现,又对于地气过程具有复杂的反馈作用。因此,地表温度不仅是气候变化的敏感指示因子和掌握气候变化规律的重要前提,还是众多模型的直接输入参数,在许多领域有广泛的应用,如气象气候、环境生态、水文等。伴随地学及相关领域研究的深入和精细化,学术界对卫星遥感的全天候地表温度(All-weather LST)具有迫切的需求。 本数据集的制备方法是增强型的卫星热红外遥感-再分析数据集成方法。方法的主要输入数据为Terra/Aqua MODIS LST产品和GLDAS等数据,辅助数据包括卫星遥感提供的植被指数、地表反照率等。方法充分利用了卫星热红外遥感和再分析数据提供的地表温度高频分量、低频分量以及地表温度的空间相关性,最终重建得到较高质量的全天候地表温度数据集。 评价结果表明,本数据集具有良好的图像质量和精度,不仅在空间上无缝,还与当前学术界广泛采用的逐日1 km Terra/Aqua MODIS LST产品在幅值和空间分布上具有较高的一致性。当以MODIS LST为参考时,该数据集在白天和夜间的平均偏差(MBE)为0.09K和-0.03K,偏差标准差(STD)为1.45K和1.17K。基于19个站点实测数据的检验结果表明,其MBE为-2.26K至1.73K,RMSE为0.80K至3.68K,且在晴空与非晴空条件下无显著区别。 本数据集的时间分辨率为逐日4次,空间分辨率为1km,时间跨度为2000年-2023年;空间范围包括我国陆域的主要区域(包含港澳台地区,暂不包含我国南海诸岛)及周边区域(72°E-135°E,19°N-55°N)。本数据集的缩写名为TRIMS LST(Thermal and Reanalysis Integrating Moderate-resolution Spatial-seamless LST),以便用户使用。需要说明的是,TRIMS LST的空间子集TRIMS LST-TP(中国西部逐日1 km全天候地表温度数据集(TRIMS LST-TP;2000-2023)V2)同步在国家青藏高原科学数据中心发布,以减少相关用户数据下载和处理的工作量。

国家青藏高原科学数据中心 收录

中国1km分辨率年平均气温数据(1901-2023年)

中国1km分辨率年平均气温数据(1901-2023年)根据西北农林科技大学彭守璋研究员团队研制的1901-2023年中国1km分辨率逐月平均气温数据集进行年度均值合成后除以10将单位换算为℃得到。数据包含多个TIF文件,每个TIF文件为对应年份的年平均气温,平均气温单位为℃。彭守璋研究员在《Earth System Science Data》以论文形式发布了1 km monthly temperature and precipitation dataset for China from 1901 to 2017数据。论文链接https://doi.org/10.5194/essd-11-1931-2019。

国家地球系统科学数据中心 收录