five

huawei-noah/CHARP|对话系统数据集|对话历史理解数据集

收藏
hugging_face2024-05-30 更新2024-06-12 收录
对话系统
对话历史理解
下载链接:
https://hf-mirror.com/datasets/huawei-noah/CHARP
下载链接
链接失效反馈
资源简介:
`CHARP`是一个诊断测试平台,专门用于评估信息寻求对话系统是否有效地关注和使用对话历史。该数据集通过修改`FaithDial`验证集中的示例来构建,以确保与`FaithDial`的最大领域对齐,并最小化注释成本。数据集包含两个子集:`eCHARP`和`hCHARP`,分别对应不需要和需要推理对话历史的示例。数据集共包含2160个示例,每个子集各1080个。数据字段包括`row_idx`、`history`、`knowledge`和`response`。

`CHARP`是一个诊断测试平台,专门用于评估信息寻求对话系统是否有效地关注和使用对话历史。该数据集通过修改`FaithDial`验证集中的示例来构建,以确保与`FaithDial`的最大领域对齐,并最小化注释成本。数据集包含两个子集:`eCHARP`和`hCHARP`,分别对应不需要和需要推理对话历史的示例。数据集共包含2160个示例,每个子集各1080个。数据字段包括`row_idx`、`history`、`knowledge`和`response`。
提供机构:
huawei-noah
AI搜集汇总
数据集介绍
main_image_url
构建方式
CHARP数据集的构建基于FaithDial验证集的修改,旨在评估信息寻求对话系统是否能有效利用对话历史。通过编辑FaithDial的示例,使其响应依赖于对话历史,CHARP确保了与FaithDial的最大领域对齐,同时最小化了注释成本。数据集包含两个子集:eCHARP(简单版)和hCHARP(困难版),分别对应于无需和需要推理对话历史的场景。
特点
CHARP数据集的显著特点在于其双层结构,分别针对不同难度的对话生成任务。eCHARP子集设计为自包含,适合基础对话生成训练;而hCHARP子集则要求模型基于对话历史和提供的知识进行推理,更具挑战性。这种设计使得CHARP成为评估和提升对话系统性能的理想工具。
使用方法
CHARP数据集适用于文本生成和对话建模任务,特别关注对话系统对历史信息的处理能力。使用者可以通过加载数据集中的eCHARP和hCHARP子集,分别进行基础和高级对话生成模型的训练与评估。数据集提供了清晰的字段结构,包括对话历史、知识源和预期响应,便于直接应用于各类对话生成模型。
背景与挑战
背景概述
在信息寻求对话系统领域,`CHARP`数据集作为诊断测试平台,旨在评估系统是否能够有效利用对话历史。该数据集由华为诺亚方舟实验室(Huawei Noah's Ark Lab)的研究人员创建,主要研究人员包括Abbas Ghaddar、David Alfonso-Hermelo、Philippe Langlais、Mehdi Rezagholizadeh、Boxing Chen和Prasanna Parthasarathi。`CHARP`通过对[FaithDial](https://huggingface.co/datasets/McGill-NLP/FaithDial)验证集的修改构建,确保与FaithDial领域的高度一致性,同时降低标注成本。其核心研究问题聚焦于对话系统对历史信息的依赖性和利用效率,对提升对话系统的自然性和连贯性具有重要影响。
当前挑战
`CHARP`数据集在构建过程中面临多项挑战。首先,确保数据集与FaithDial的高度领域一致性,同时降低标注成本,是一项复杂任务。其次,数据集分为两个子集:`eCHARP`和`hCHARP`,分别代表无需和需要推理对话历史的难度级别,这要求在数据标注和处理过程中保持高度的准确性和一致性。此外,评估对话系统对历史信息的依赖性,需要设计有效的评估指标和方法,以确保测试结果的可靠性和有效性。这些挑战共同构成了`CHARP`数据集在推动对话系统研究中的重要课题。
常用场景
经典使用场景
在信息寻求对话系统领域,CHARP数据集被广泛用于评估系统是否能够有效利用对话历史。该数据集通过修改FaithDial验证集中的示例,确保其与FaithDial领域高度一致,从而减少注释成本。CHARP包含两个子集:eCHARP(简单版)和hCHARP(困难版),分别用于测试系统在无需和需要推理对话历史情况下的表现。
解决学术问题
CHARP数据集解决了对话系统中常见的学术问题,即系统是否能够正确理解和利用对话历史。通过提供不同难度的对话示例,CHARP帮助研究人员评估和改进对话系统在处理复杂对话时的表现,从而推动了知识驱动对话系统的发展。
衍生相关工作
基于CHARP数据集,研究人员开发了多种改进对话系统的方法,包括增强对话历史理解和推理能力的模型。此外,CHARP还启发了其他相关数据集的创建,如针对特定领域对话历史的评估数据集,进一步推动了对话系统领域的研究和发展。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

PCLT20K

PCLT20K数据集是由湖南大学等机构创建的一个大规模PET-CT肺癌肿瘤分割数据集,包含来自605名患者的21,930对PET-CT图像,所有图像都带有高质量的像素级肿瘤区域标注。该数据集旨在促进医学图像分割研究,特别是在PET-CT图像中肺癌肿瘤的分割任务。

arXiv 收录

FER2013

FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。

github 收录

Subway Dataset

该数据集包含了全球多个城市的地铁系统数据,包括车站信息、线路图、列车时刻表、乘客流量等。数据集旨在帮助研究人员和开发者分析和模拟城市交通系统,优化地铁运营和乘客体验。

www.kaggle.com 收录

AISHELL/AISHELL-1

Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。

hugging_face 收录