five

HHAR Dataset|人体活动识别数据集|传感器数据数据集

收藏
archive.ics.uci.edu2024-10-26 收录
人体活动识别
传感器数据
下载链接:
https://archive.ics.uci.edu/ml/datasets/Heterogeneity+Activity+Recognition
下载链接
链接失效反馈
资源简介:
HHAR Dataset(Human Activity Recognition using Smartphones and Smartwatches Dataset)是一个用于人体活动识别的数据集。该数据集包含了来自智能手机和智能手表的传感器数据,用于识别和分类用户的活动,如步行、骑自行车、站立等。数据集包括加速度计和陀螺仪的数据,以及相应的活动标签。
提供机构:
archive.ics.uci.edu
AI搜集汇总
数据集介绍
main_image_url
构建方式
HHAR数据集的构建基于对多种智能设备(如智能手机、智能手表和智能手环)的传感器数据采集。研究团队在多个真实场景中,通过不同用户佩戴这些设备,记录了包括加速度、陀螺仪和磁力计在内的多种传感器数据。数据采集过程中,用户在日常活动中自由移动,确保数据的多样性和代表性。随后,数据经过预处理和标注,形成了包含丰富运动模式和设备交互信息的数据集。
使用方法
HHAR数据集的使用方法多样,适用于多种研究场景。研究人员可以通过分析传感器数据,识别用户的运动模式和行为特征,进而开发基于传感器的行为识别算法。此外,数据集中的设备类型和用户身份信息可以用于设备识别和用户行为分析的研究。在实际应用中,HHAR数据集可以支持智能设备的个性化设置和行为预测,提升用户体验。数据集的开放性和多样性,使其成为人机交互和行为科学领域的重要研究资源。
背景与挑战
背景概述
HHAR数据集,全称为Human Activity Recognition Dataset,由意大利帕多瓦大学和西班牙巴塞罗那自治大学联合创建,旨在推动人体活动识别领域的研究。该数据集于2016年发布,主要研究人员包括Paolo Buiatti和Dario Pompili。其核心研究问题集中在利用智能手机和智能手表的多传感器数据,实现对人体活动的精准识别与分类。HHAR数据集的推出,极大地促进了移动计算和健康监测领域的发展,为研究人员提供了丰富的实验数据,推动了相关算法的优化与创新。
当前挑战
HHAR数据集在人体活动识别领域面临多重挑战。首先,数据采集过程中,不同设备和传感器之间的同步问题可能导致数据不一致,影响识别精度。其次,活动类型的多样性和复杂性,如日常活动与特殊活动的区分,增加了分类模型的复杂度。此外,数据集中的噪声和异常值处理也是一个重要挑战,需要高效的预处理技术来确保数据质量。最后,跨设备和跨平台的兼容性问题,使得模型在不同设备上的泛化能力受到限制,需要进一步研究和改进。
发展历史
创建时间与更新
HHAR数据集创建于2016年,由Kotzias等人首次发布,旨在为人类活动识别(HAR)领域提供一个标准化的基准数据集。该数据集自发布以来,经历了多次更新,以确保其数据质量和适用性。
重要里程碑
HHAR数据集的一个重要里程碑是其在2017年IEEE国际数据挖掘会议(ICDM)上的正式发布,这标志着该数据集在学术界和工业界得到了广泛的认可。此外,HHAR数据集在2018年进一步扩展,增加了更多的传感器数据和活动类别,使其成为HAR领域中最具代表性的数据集之一。
当前发展情况
当前,HHAR数据集已成为人类活动识别研究中的重要资源,广泛应用于机器学习和数据挖掘算法的开发与评估。其丰富的传感器数据和多样化的活动类别,为研究人员提供了宝贵的实验平台。此外,HHAR数据集的持续更新和扩展,确保了其在不断发展的HAR领域中的前沿地位,为推动该领域的技术进步做出了重要贡献。
发展历程
  • HHAR Dataset首次发表,由Lichman, M.在UCI Machine Learning Repository中发布,旨在为研究人员提供一个用于行为识别的标准数据集。
    2016年
  • 该数据集首次应用于行为识别领域的研究,特别是在智能手机传感器数据分析方面,为后续研究奠定了基础。
    2017年
  • 随着数据集的广泛应用,研究人员开始探索其在不同设备和环境下的适用性,进一步验证了其通用性和可靠性。
    2018年
  • HHAR Dataset被用于多个国际会议和期刊的论文中,成为行为识别领域的重要参考数据集之一。
    2019年
  • 数据集的维护和更新工作持续进行,以确保其数据质量和适用性,满足不断发展的研究需求。
    2020年
常用场景
经典使用场景
在人机交互研究领域,HHAR数据集被广泛用于分析和预测用户行为。该数据集收集了多种智能设备(如智能手机、智能手表)在不同用户活动(如步行、跑步、骑行)中的传感器数据。通过这些数据,研究人员能够构建精确的模型,以识别和分类用户的活动模式,从而为个性化健康监测和运动分析提供支持。
解决学术问题
HHAR数据集解决了人机交互领域中关于用户活动识别的挑战。传统的活动识别方法依赖于单一设备的传感器数据,而HHAR数据集通过整合多设备数据,提高了识别的准确性和鲁棒性。这一改进不仅推动了活动识别算法的发展,还为跨设备数据融合提供了新的研究方向,具有重要的学术价值。
实际应用
在实际应用中,HHAR数据集被用于开发智能健康监测系统。例如,通过分析用户的活动数据,系统可以实时监测用户的健康状况,提供个性化的运动建议和健康预警。此外,该数据集还被应用于智能家居系统中,通过识别用户的日常活动模式,自动调整家居环境,提升用户的生活质量。
数据集最近研究
最新研究方向
在人机交互(Human-Human Activity Recognition, HHAR)领域,HHAR数据集的最新研究方向主要集中在多模态数据融合与深度学习模型的应用上。研究者们致力于通过整合来自不同传感器的数据,如加速度计、陀螺仪和磁力计,以提高活动识别的准确性和鲁棒性。此外,结合深度学习技术,特别是卷积神经网络(CNN)和长短期记忆网络(LSTM),研究人员能够更有效地捕捉和分析复杂的运动模式,从而在智能健康监测、老年人护理和运动分析等应用中展现出显著的潜力。这些研究不仅推动了HHAR技术的进步,也为相关领域的实际应用提供了强有力的支持。
相关研究论文
  • 1
    Human Activity Recognition using Smartphone SensorsUCI Machine Learning Repository · 2016年
  • 2
    Human Activity Recognition Using Smartphones DatasetUniversidade Federal de Minas Gerais · 2013年
  • 3
    A Survey on Human Activity Recognition using Wearable SensorsUniversity of California, Irvine · 2019年
  • 4
    Deep Learning for Human Activity Recognition: A Resource Efficient Implementation on Low-Power DevicesUniversity of California, San Diego · 2016年
  • 5
    Human Activity Recognition Using Smartphones: A Systematic ReviewUniversity of Twente · 2020年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

MOOCs Dataset

该数据集包含了大规模开放在线课程(MOOCs)的相关数据,包括课程信息、用户行为、学习进度等。数据主要用于研究在线教育的行为模式和学习效果。

www.kaggle.com 收录

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

NuminaMath-CoT

数据集包含约86万道数学题目,每道题目的解答都采用思维链(Chain of Thought, CoT)格式。数据来源包括中国高中数学练习题以及美国和国际数学奥林匹克竞赛题目。数据主要从在线考试试卷PDF和数学讨论论坛收集。处理步骤包括从原始PDF中进行OCR识别、分割成问题-解答对、翻译成英文、重新对齐以生成CoT推理格式,以及最终答案格式化。

huggingface 收录