five

linxy/ICEWS05_15|时间知识图谱数据集|复杂推理数据集

收藏
hugging_face2024-05-05 更新2024-06-12 收录
时间知识图谱
复杂推理
下载链接:
https://hf-mirror.com/datasets/linxy/ICEWS05_15
下载链接
链接失效反馈
资源简介:
该数据集用于时间知识图推理任务,基于ICEWS和GDELT这两个广泛使用的基准。数据集首次在论文《TFLEX: Temporal Feature-Logic Embedding Framework for Complex Reasoning over Temporal Knowledge Graph》中引入。数据集包含训练、验证和测试集,提供了查询示例和元信息加载方法,支持查询类型特定的子部分。

该数据集用于时间知识图推理任务,基于ICEWS和GDELT这两个广泛使用的基准。数据集首次在论文《TFLEX: Temporal Feature-Logic Embedding Framework for Complex Reasoning over Temporal Knowledge Graph》中引入。数据集包含训练、验证和测试集,提供了查询示例和元信息加载方法,支持查询类型特定的子部分。
提供机构:
linxy
AI搜集汇总
数据集介绍
main_image_url
构建方式
ICEWS05_15数据集构建于广泛使用的时序知识图谱基准ICEWS和GDELT之上,旨在支持时序知识图谱推理任务。该数据集首次在论文《TFLEX: Temporal Feature-Logic Embedding Framework for Complex Reasoning over Temporal Knowledge Graph》中引入,通过整合多个时序知识图谱的实体、关系和时间戳,构建了一个包含复杂查询和答案的多样化数据集。
使用方法
使用ICEWS05_15数据集时,用户可以通过HuggingFace的`load_dataset`函数加载数据集,并选择不同的子集进行训练、验证和测试。数据集提供了多种查询类型的子集,用户可以根据需求加载特定的查询类型。此外,数据集还提供了元信息,用户可以通过这些信息将查询中的ID解码为具体的实体、关系和时间戳名称,从而进行更深入的分析和推理。
背景与挑战
背景概述
ICEWS05_15数据集是基于时间知识图谱推理任务构建的,主要用于解决复杂的时间知识图谱推理问题。该数据集建立在广泛使用的ICEWS和GDELT基准之上,首次在2023年由Lin Xueyuan等人提出的论文《TFLEX: Temporal Feature-Logic Embedding Framework for Complex Reasoning over Temporal Knowledge Graph》中引入。该数据集的核心研究问题是如何在时间知识图谱中进行复杂的推理,其影响力在于为时间知识图谱推理领域的研究提供了新的基准和挑战,推动了该领域的发展。
当前挑战
ICEWS05_15数据集面临的挑战主要集中在时间知识图谱推理的复杂性上。首先,数据集中的时间序列信息和实体关系的动态变化增加了推理的难度。其次,构建过程中需要处理大量的时间戳和关系数据,确保数据的准确性和一致性。此外,如何有效地将时间特征与逻辑嵌入相结合,以实现高效的复杂推理,也是该数据集面临的重要挑战。这些挑战不仅推动了时间知识图谱推理技术的发展,也为相关领域的研究提供了新的思路和方法。
常用场景
经典使用场景
ICEWS05_15数据集主要用于时间知识图谱推理任务,特别是在处理复杂的时间序列关系时表现尤为突出。该数据集通过提供丰富的实体、关系和时间戳信息,支持模型在时间维度上进行深度推理,适用于多种查询类型,如实体查询、关系查询和时间查询。其经典使用场景包括但不限于时间知识图谱的构建、时间序列预测以及复杂事件推理等。
解决学术问题
ICEWS05_15数据集解决了时间知识图谱领域中复杂推理的核心问题,特别是在处理多跳查询和时间依赖性方面。通过提供大规模的时间序列数据,该数据集为研究者提供了一个标准化的基准,用于评估和改进时间知识图谱推理算法。其意义在于推动了时间知识图谱推理技术的发展,为相关领域的研究提供了坚实的基础。
实际应用
在实际应用中,ICEWS05_15数据集可广泛应用于情报分析、社会事件预测、金融风险评估等领域。通过分析历史事件的时间序列关系,模型能够预测未来可能发生的事件,从而为决策提供支持。此外,该数据集还可用于智能推荐系统,通过理解用户行为的时间模式,提供更加精准的个性化推荐。
数据集最近研究
最新研究方向
在时序知识图谱(Temporal Knowledge Graph, TKGC)领域,ICEWS05_15数据集的最新研究方向主要集中在复杂推理任务上。该数据集基于广泛使用的ICEWS和GDELT基准,首次在论文《TFLEX: Temporal Feature-Logic Embedding Framework for Complex Reasoning over Temporal Knowledge Graph》中引入,旨在通过时序特征逻辑嵌入框架解决复杂推理问题。研究者们致力于开发高效的嵌入模型,以捕捉时序知识图谱中的动态变化,并提升推理的准确性和效率。这一方向的研究不仅推动了时序知识图谱在实际应用中的发展,如事件预测和因果关系分析,还为相关领域的算法创新提供了新的思路和基准。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国农村金融统计数据

该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。

www.pbc.gov.cn 收录

中国交通事故深度调查(CIDAS)数据集

交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、

北方大数据交易中心 收录

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

PCLT20K

PCLT20K数据集是由湖南大学等机构创建的一个大规模PET-CT肺癌肿瘤分割数据集,包含来自605名患者的21,930对PET-CT图像,所有图像都带有高质量的像素级肿瘤区域标注。该数据集旨在促进医学图像分割研究,特别是在PET-CT图像中肺癌肿瘤的分割任务。

arXiv 收录

Subway Dataset

该数据集包含了全球多个城市的地铁系统数据,包括车站信息、线路图、列车时刻表、乘客流量等。数据集旨在帮助研究人员和开发者分析和模拟城市交通系统,优化地铁运营和乘客体验。

www.kaggle.com 收录