five

StudentLife Dataset|教育数据分析数据集|心理健康监测数据集

收藏
github2020-09-19 更新2024-05-31 收录
教育数据分析
心理健康监测
下载链接:
https://github.com/Chirag-Bansal/StudentLife-Dataset
下载链接
链接失效反馈
资源简介:
StudentLife数据集是一个使用学生手机传感数据来评估其心理健康、学术表现和行为趋势的数据集。

The StudentLife dataset is a collection that utilizes smartphone sensor data from students to assess their mental health, academic performance, and behavioral trends.
创建时间:
2020-03-01
AI搜集汇总
数据集介绍
main_image_url
构建方式
StudentLife Dataset通过收集学生手机中的感知数据,构建了一个用于评估学生心理健康、学术表现和行为趋势的数据集。数据集的构建过程中,首先从达特茅斯大学网站获取了原始数据,并将其转换为R tibbles格式。随后,通过编写Python脚本`CreateCsv.py`将数据转换为CSV格式,以便于后续处理。为了适应预测任务的需求,数据集中的时间戳信息被转换为每小时的时间格式,并去除了未知位置的活动数据。最终,数据被分为训练集和测试集,分别用于学生0-49和学生50-59的活动预测。
使用方法
使用StudentLife Dataset时,研究者可以通过加载`final.csv`和`final_test.csv`文件进行训练和测试。数据集的每条记录包含学生ID、天数、小时、活动类型和持续时间等字段,适合用于回归问题的建模。研究者可以选择不同的回归算法,如决策树回归、随机森林回归、多项式回归、XGBoost和神经网络等,来预测学生的活动持续时间。通过比较不同模型的均方误差(MAE),可以选择最优的模型进行进一步分析和应用。
背景与挑战
背景概述
StudentLife Dataset是由达特茅斯学院的研究团队创建的,旨在通过收集学生手机中的感知数据来评估其心理健康、学术表现和行为趋势。该数据集的核心研究问题是通过分析学生的物理活动数据(如静止、行走或跑步),预测学生未来一小时的活动状态。这一研究不仅为心理健康评估提供了新的数据支持,还为行为预测和个性化教育提供了潜在的应用价值。
当前挑战
StudentLife Dataset在构建过程中面临多项挑战。首先,数据集需要从UNIX时间戳中提取每秒的学生位置信息,并将其转换为每小时的数据格式,这一过程涉及复杂的数据处理和时间序列分析。其次,数据集中存在未知位置的活动数据(标记为3),这些数据对结果产生干扰,需进行剔除。此外,不同学生的行为模式差异显著,使用通用模型进行预测可能导致误差,因此需要针对个体进行个性化预测。
常用场景
经典使用场景
StudentLife Dataset的经典使用场景主要集中在通过学生手机传感器数据来预测其未来的活动模式。该数据集通过收集学生在不同时间段内的活动状态(如静止、行走或跑步),结合时间戳信息,构建了一个基于回归问题的预测模型。研究者可以利用这些数据来预测学生在接下来一小时内可能的活动类型及其持续时间,从而为个性化健康管理和学术表现评估提供数据支持。
解决学术问题
StudentLife Dataset解决了心理学和教育学领域中关于学生行为模式与心理健康、学术表现之间关系的研究问题。通过分析学生的日常活动数据,研究者可以深入探讨学生的行为习惯如何影响其心理状态和学业成绩。这一数据集为研究者提供了一个量化分析的工具,有助于揭示潜在的行为模式与心理健康之间的关联,从而为制定干预措施提供科学依据。
实际应用
StudentLife Dataset在实际应用中具有广泛的前景,特别是在个性化健康管理和教育干预领域。例如,学校可以通过分析学生的活动数据,及时发现其心理健康问题并提供相应的支持。此外,教育机构可以利用这些数据来优化课程安排,确保学生在学习过程中保持良好的身心状态。该数据集还可用于开发智能健康监测系统,帮助学生更好地管理自己的日常活动和健康状况。
数据集最近研究
最新研究方向
在心理健康与行为分析领域,StudentLife Dataset凭借其对学生日常活动数据的细致捕捉,成为研究学生心理状态与行为模式的重要资源。该数据集通过手机传感技术,收集了学生的物理活动、位置信息等数据,旨在预测学生未来的活动趋势,进而评估其心理健康状况。近年来,研究者们利用该数据集探索了多种机器学习算法,如决策树回归、随机森林回归、XGBoost等,以提高活动预测的准确性。特别值得注意的是,个性化预测模型的引入,通过利用个体学生的历史数据进行预测,显著降低了预测误差,为个性化心理干预提供了新的可能性。这一研究方向不仅推动了心理健康评估的精确化,也为教育领域中的个性化支持系统奠定了技术基础。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

中国交通事故深度调查(CIDAS)数据集

交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、

北方大数据交易中心 收录

Beijing Traffic

The Beijing Traffic Dataset collects traffic speeds at 5-minute granularity for 3126 roadway segments in Beijing between 2022/05/12 and 2022/07/25.

Papers with Code 收录

OpenSonarDatasets

OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。

github 收录

中国省级灾害统计空间分布数据集(1999-2020年)

该数据集为中国省级灾害统计空间分布数据集,时间为1999-2020年。该数据集包含中国各省自然灾害、地质灾害、地震灾害、森林火灾、森林病虫鼠害、草原灾害六类灾害的详细数据。数据量为206MB,数据格式为excel。

国家地球系统科学数据中心 收录