five

Psych-101|心理学数据集|认知模型数据集

收藏
huggingface2024-11-03 更新2024-12-12 收录
心理学
认知模型
下载链接:
https://huggingface.co/datasets/marcelbinz/Psych-101
下载链接
链接失效反馈
资源简介:
Psych-101数据集是一个自然语言转录的心理学实验数据集,包含了160个心理学实验的逐次数据,涉及60,092名参与者,共记录了10,681,650次选择。数据集中的选择信息被封装在“<<”和“>>”标记中。数据集的主要用途是研究人类认知的基础模型。数据集提供了详细的实验文本、实验标识符和参与者标识符。数据集的语言为英语,使用Apache 2.0许可证。
创建时间:
2024-10-23
AI搜集汇总
数据集介绍
main_image_url
构建方式
Psych-101数据集构建基于160项心理学实验的自然语言转录数据,涵盖了60,092名参与者的10,681,650次选择。数据通过实验中的逐项记录生成,参与者的选择被封装在特定的标记符号中,确保了数据的完整性和可追溯性。
特点
该数据集的特点在于其广泛覆盖了心理学实验的多样性,提供了丰富的自然语言转录数据。每个实验和参与者的选择均被详细记录,且数据以结构化的形式呈现,便于研究者进行深入分析。此外,数据集中的选择行为通过特定标记符号进行标注,增强了数据的可读性和可解释性。
使用方法
使用Psych-101数据集时,研究者可通过`datasets`库中的`load_dataset`函数直接加载数据。数据集包含三个主要字段:实验的自然语言转录文本、实验标识符以及参与者标识符。通过分析这些字段,研究者可以深入探讨人类认知行为及其背后的心理学机制。
背景与挑战
背景概述
Psych-101数据集由Marcel Binz等研究人员于2024年发布,旨在为心理学实验提供自然语言转录数据。该数据集涵盖了160项心理学实验,涉及60,092名参与者,共计10,681,650次选择。其核心研究问题在于通过大规模实验数据,探索人类认知行为的基本模式,并为构建人类认知的基础模型提供支持。该数据集与《Centaur: a foundation model of human cognition》论文密切相关,为心理学与人工智能的交叉研究提供了重要资源,推动了认知科学领域的发展。
当前挑战
Psych-101数据集在解决心理学实验数据的标准化与大规模分析方面面临显著挑战。首先,心理学实验的多样性与复杂性使得数据标注与整合成为难题,需要确保实验设计的统一性与数据的可解释性。其次,自然语言转录的准确性要求极高,需避免语义偏差与信息丢失。此外,数据集的构建过程中,如何平衡参与者隐私保护与数据开放共享也是一个关键问题。这些挑战不仅影响了数据集的可用性,也对后续研究提出了更高的技术要求。
常用场景
经典使用场景
在心理学研究中,Psych-101数据集被广泛应用于分析人类决策行为。通过包含160项心理学实验的逐次试验数据,研究者能够深入探讨人类在面对复杂选择时的认知机制。该数据集为心理学实验提供了丰富的自然语言转录,使得研究者能够在实验室环境之外,模拟真实世界中的决策场景。
实际应用
在实际应用中,Psych-101数据集被用于开发智能系统,以模拟人类的决策过程。例如,在人工智能领域,该数据集可用于训练模型,使其能够更好地理解和预测人类行为。此外,该数据集还可用于教育领域,帮助学生和研究者通过分析实验数据,深入理解心理学中的决策理论。
衍生相关工作
基于Psych-101数据集,研究者们开展了多项经典工作。例如,Marcel Binz等人提出的Centaur模型,利用该数据集构建了一个人类认知的基础模型。该模型不仅在心理学领域产生了广泛影响,还为人工智能的发展提供了新的思路。此外,该数据集还激发了多项关于人类决策行为的研究,推动了认知科学和人工智能的交叉融合。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

中国省级灾害统计空间分布数据集(1999-2020年)

该数据集为中国省级灾害统计空间分布数据集,时间为1999-2020年。该数据集包含中国各省自然灾害、地质灾害、地震灾害、森林火灾、森林病虫鼠害、草原灾害六类灾害的详细数据。数据量为206MB,数据格式为excel。

国家地球系统科学数据中心 收录

URPC系列数据集, S-URPC2019, UDD

URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。

github 收录

Obstacle-dataset OD

该数据集用于十五种障碍物检测,包含VOC格式和YOLO训练的.txt文件,数据集中的图像来自VOC数据集、COCO数据集、TT100K数据集以及作者团队实地收集的图片。

github 收录