ARC|科学问答数据集|推理挑战数据集
收藏
- ARC数据集首次发表,由AI2(Allen Institute for AI)发布,旨在评估机器阅读理解系统在复杂推理任务中的表现。
- ARC数据集首次应用于多个机器阅读理解竞赛和研究项目中,成为评估模型推理能力的重要基准。
- ARC数据集的扩展版本发布,增加了更多的复杂推理问题,进一步推动了相关研究的发展。
- ARC数据集被广泛应用于学术界和工业界的多个研究项目中,成为衡量模型推理能力的重要工具。
- 1ARC: A Benchmark for Research on Learning from Compact LabelsUniversity of California, Berkeley · 2021年
- 2Learning from Compact Labels: A Survey on Compact Label LearningTsinghua University · 2022年
- 3Compact Label Learning for Few-Shot Image ClassificationUniversity of Science and Technology of China · 2021年
- 4ARC: A Dataset for Learning from Compact Labels in Natural Language ProcessingUniversity of Cambridge · 2021年
- 5ARC: A Benchmark for Evaluating Compact Label Learning in Medical ImagingStanford University · 2022年
PCLT20K
PCLT20K数据集是由湖南大学等机构创建的一个大规模PET-CT肺癌肿瘤分割数据集,包含来自605名患者的21,930对PET-CT图像,所有图像都带有高质量的像素级肿瘤区域标注。该数据集旨在促进医学图像分割研究,特别是在PET-CT图像中肺癌肿瘤的分割任务。
arXiv 收录
Beijing Traffic
The Beijing Traffic Dataset collects traffic speeds at 5-minute granularity for 3126 roadway segments in Beijing between 2022/05/12 and 2022/07/25.
Papers with Code 收录
Plant-Diseases
Dataset for Plant Diseases containg variours Plant Disease
kaggle 收录
THUCNews
THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。
github 收录
CliMedBench
CliMedBench是一个大规模的中文医疗大语言模型评估基准,由华东师范大学等机构创建。该数据集包含33,735个问题,涵盖14个核心临床场景,主要来源于顶级三级医院的真实电子健康记录和考试练习。数据集的创建过程包括专家指导的数据选择和多轮质量控制,确保数据的真实性和可靠性。CliMedBench旨在评估和提升医疗大语言模型在临床决策支持、诊断和治疗建议等方面的能力,解决医疗领域中模型性能评估的不足问题。
arXiv 收录