five

Abstraction and Reasoning Corpus (ARC)|视觉推理数据集|抽象推理数据集

收藏
arXiv2025-01-08 更新2025-01-10 收录
视觉推理
抽象推理
下载链接:
https://github.com/Batorskq/NSA
下载链接
链接失效反馈
资源简介:
Abstraction and Reasoning Corpus (ARC) 是一个用于评估机器学习模型视觉推理能力的基准数据集,由海因里希·海涅大学杜塞尔多夫分校和曼海姆大学的研究团队创建。该数据集包含400个任务,每个任务通常有3到4个输入/输出对,数据量相对较小。数据集通过合成生成更多训练数据来增强模型的预训练和微调过程。ARC数据集的应用领域主要集中在视觉推理和抽象推理任务,旨在解决现有机器学习模型在复杂视觉推理任务中的不足。
提供机构:
海因里希·海涅大学杜塞尔多夫分校, 曼海姆大学
创建时间:
2025-01-08
AI搜集汇总
数据集介绍
main_image_url
构建方式
Abstraction and Reasoning Corpus (ARC) 数据集的构建基于神经符号方法,结合了Transformer模型和组合搜索技术。首先,通过Transformer模型生成潜在的转换原语,随后利用领域特定语言(DSL)进行组合搜索,以确定正确的转换和参数。为了增强模型的泛化能力,研究者通过合成数据对Transformer进行预训练,并在测试时生成任务特定的训练数据进行微调。这种构建方式不仅提升了模型的推理能力,还显著减少了搜索时间。
特点
ARC数据集的特点在于其高度抽象和多样化的任务设计,旨在评估模型的通用推理能力。数据集包含400个训练任务,每个任务通常由3到4个输入输出对组成,任务类型涵盖了视觉模式匹配和有限推理。ARC任务的复杂性使得传统的机器学习模型和组合搜索方法难以应对,而人类则能够轻松解决大部分任务。这种特性使得ARC成为评估模型抽象推理能力的理想基准。
使用方法
ARC数据集的使用方法主要包括神经符号搜索和测试时适应(TTA)。在神经符号搜索中,Transformer模型生成转换原语建议,组合搜索则基于这些建议找到正确的转换。测试时适应通过在推理阶段生成额外的任务特定训练数据,对模型进行微调,以进一步提升性能。这种方法不仅显著提高了模型的推理效率,还使其在ARC评估集上的表现超越了现有的最先进方法。
背景与挑战
背景概述
Abstraction and Reasoning Corpus (ARC) 是由 François Chollet 于2019年提出的一个用于评估机器学习和组合搜索方法在抽象推理能力上的基准数据集。ARC旨在测试模型在视觉推理任务中的表现,尤其是那些对人类来说相对简单但对现有机器学习模型和组合搜索方法极具挑战性的任务。该数据集的核心研究问题在于如何通过少量示例(few-shot learning)来推断出复杂的视觉模式转换规则。ARC的创建推动了人工智能领域在抽象推理和视觉模式识别方面的研究,成为衡量模型通用推理能力的重要工具。
当前挑战
ARC数据集面临的主要挑战在于其任务的多样性和复杂性。首先,ARC任务要求模型能够从极少的示例中推断出复杂的视觉模式转换规则,这对现有的机器学习模型和组合搜索方法提出了极高的要求。其次,构建ARC数据集的过程中,研究人员需要设计出既具有挑战性又对人类来说直观易懂的任务,这要求任务设计者在抽象推理和视觉模式识别之间找到平衡。此外,ARC任务的多样性使得传统的组合搜索方法难以有效应对,因为搜索空间的复杂性和多样性使得找到合适的转换规则变得极为困难。这些挑战促使研究人员探索新的方法,如神经符号结合的方法,以提升模型在ARC任务上的表现。
常用场景
经典使用场景
Abstraction and Reasoning Corpus (ARC) 数据集主要用于评估机器学习模型在视觉推理任务中的抽象和推理能力。其经典使用场景包括通过少量示例(few-shot learning)来测试模型是否能够从输入-输出对中推断出潜在的转换规则,并应用于新的测试输入。这种场景模拟了人类在面对新问题时,通过有限的观察快速推理出解决方案的能力。
实际应用
ARC 数据集的实际应用场景广泛,尤其是在需要高度抽象推理的领域,如自动化编程、机器人任务规划和智能教育系统。例如,在自动化编程中,模型可以通过 ARC 数据集学习如何从少量示例中推断出代码转换规则,从而生成符合需求的程序。此外,ARC 数据集还可用于开发智能教育工具,帮助学生在有限的示例下快速掌握复杂的概念和规则。
衍生相关工作
ARC 数据集衍生了许多经典的研究工作,尤其是在神经符号方法的探索上。例如,ARGA(Abstract Reasoning with Graph Abstractions)通过图抽象和组合搜索方法,尝试解决 ARC 任务中的复杂转换问题。此外,NSA(Neuro-symbolic ARC Challenge)结合了 Transformer 模型和符号搜索,显著提升了模型在 ARC 任务上的表现。这些工作不仅推动了 ARC 数据集的应用,还为其他领域的抽象推理任务提供了新的研究思路。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

Subway Dataset

该数据集包含了全球多个城市的地铁系统数据,包括车站信息、线路图、列车时刻表、乘客流量等。数据集旨在帮助研究人员和开发者分析和模拟城市交通系统,优化地铁运营和乘客体验。

www.kaggle.com 收录

Breast Cancer Dataset

该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。

github 收录

中国知识产权局专利数据库

该数据集包含了中国知识产权局发布的专利信息,涵盖了专利的申请、授权、转让等详细记录。数据内容包括专利号、申请人、发明人、申请日期、授权日期、专利摘要等。

www.cnipa.gov.cn 收录

Lifan-Z/Chinese-poetries-txt

这个数据集从《全唐诗》和《全宋诗》中提取了四种不同风格的诗歌,包括五绝(5x4)17521首、五律(5x8)60896首、七绝(7x4)84485首和七律(7x8)71818首。每行数据对应一首诗,适用于文本生成任务。

hugging_face 收录