five

Financial Numeric Extreme Labelling (FNXL)|金融数据处理数据集|自动化标注数据集

收藏
arXiv2023-06-06 更新2024-06-21 收录
金融数据处理
自动化标注
142,922条
下载链接:
https://www.sec.gov/
下载链接
链接失效反馈
资源简介:
FNXL数据集由印度理工学院卡拉格普尔分校和高盛数据科学与机器学习团队创建,专注于金融领域的数字极端标注。该数据集包含79,088个句子,总计142,922个数字被标注,使用2,794个标签。数据来源于美国证券交易委员会(SEC)要求的公开年度报告,这些报告使用XBRL进行标注。创建过程中,数据集排除了非美国通用会计准则(US-GAAP)标签,并进行了手动清理以去除噪声数据点。FNXL数据集主要用于自动化财务报告中的数字标注任务,旨在减少手动标注的工作量,并提高对新旧报告的标注效率。
提供机构:
印度理工学院卡拉格普尔分校、高盛数据科学与机器学习
开放时间:
2023-06-06
创建时间:
2023-06-06