five

MHAD: Multimodal Home Activity Dataset|多模态数据数据集|家庭活动识别数据集

收藏
github2024-08-30 更新2024-09-18 收录
多模态数据
家庭活动识别
下载链接:
https://github.com/jdh-algo/MHAD-Dataset
下载链接
链接失效反馈
资源简介:
MHAD数据集是由京东健康、华中科技大学和浙江大学联合收集的第一个真实家庭环境中的多模态数据集,包含不同拍摄角度和各种家庭场景。它包含了迄今为止最全面的生理信号,是计算机视觉、机器学习和生物医学工程等多个学术研究领域的宝贵资源。
创建时间:
2024-08-30
AI搜集汇总
数据集介绍
main_image_url
构建方式
MHAD数据集由京东健康、华中科技大学和浙江大学联合构建,旨在捕捉真实家庭环境中的多角度视频和同步生理信号。该数据集通过在不同家庭场景中设置多个摄像头,记录了受试者在进行各种日常活动时的多角度视频数据。同时,通过同步采集的心率、呼吸率等生理信号,确保了数据的全面性和准确性。这种多模态数据的整合,为研究者提供了丰富的信息资源,有助于深入探索人类行为与生理状态之间的关系。
特点
MHAD数据集的显著特点在于其多模态数据的全面性和同步性。数据集不仅包含了多角度视频记录,还同步采集了包括心率、呼吸率在内的多种生理信号,这在当前公开数据集中是极为罕见的。此外,数据集涵盖了多种家庭场景,如看电视、使用手机、阅读等,为研究者提供了多样化的研究素材。这些特点使得MHAD数据集成为计算机视觉、机器学习和生物医学工程等领域研究的宝贵资源。
使用方法
MHAD数据集主要面向学术研究,禁止任何商业用途。研究者需通过官方学术邮箱发送申请,详细说明研究目的和使用计划,并承诺仅用于学术研究。申请获批后,研究者将获得一个安全的下载链接。数据集的结构清晰,每个受试者的数据被分类存储在不同的文件夹中,包含多角度视频和相应的生理信号数据。研究者可以根据需要提取和分析这些数据,以支持其学术研究。
背景与挑战
背景概述
MHAD(Multimodal Home Activity Dataset)是由京东健康、华中科技大学和浙江大学联合创建的多模态家庭活动数据集。该数据集首次在真实家庭环境中收集了多角度视频和同步生理信号,涵盖了多种家庭场景。MHAD不仅包括了心率、呼吸率等全面的生理信号,还提供了多角度视频记录,为计算机视觉、机器学习和生物医学工程等领域的学术研究提供了宝贵的资源。其创建时间为2024年,主要研究人员包括Lei Yu、Jintao Fei等,核心研究问题是如何在真实家庭环境中有效捕捉和分析多模态数据,以推动相关领域的技术进步。
当前挑战
MHAD数据集在构建过程中面临了多重挑战。首先,如何在真实家庭环境中确保数据采集的准确性和同步性是一个主要问题。其次,多角度视频的采集和处理需要复杂的设备和技术支持,以确保视频数据的质量和一致性。此外,生理信号的同步采集和分析也面临技术难题,如信号噪声的过滤和数据对齐。这些挑战不仅影响了数据集的构建效率,也对后续的研究和应用提出了更高的技术要求。
常用场景
经典使用场景
在计算机视觉与生物医学工程的交叉领域,MHAD数据集以其多角度视频和同步生理信号的独特组合,成为研究家庭活动识别与生理状态监测的经典工具。该数据集通过捕捉真实家庭环境中的多种日常活动,如看电视、使用手机、阅读等,为研究人员提供了丰富的视觉与生理数据,从而推动了活动识别算法的优化与生理信号分析模型的精进。
解决学术问题
MHAD数据集在学术研究中解决了多角度视频与生理信号同步采集的难题,为计算机视觉与生物医学工程领域提供了宝贵的数据资源。其丰富的生理信号数据,包括心率、呼吸率等,使得研究人员能够深入探讨活动与生理状态之间的关联,推动了个性化健康监测与行为分析的发展。此外,该数据集的多角度视频数据也为复杂场景下的活动识别提供了新的研究方向。
衍生相关工作
基于MHAD数据集,研究人员开发了多种活动识别与生理状态监测算法,推动了相关领域的技术进步。例如,有研究利用该数据集训练深度学习模型,实现了高精度的家庭活动识别;还有研究通过分析同步的生理信号,提出了新的健康状态评估方法。此外,MHAD数据集还激发了多模态数据融合的研究,促进了计算机视觉与生物医学工程的跨学科合作。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

HyperGlobal-450K - 全球最大规模高光谱图像数据集

HyperGlobal-450K数据集由武汉大学联合国内外多所知名高校及研究机构共同构建,是迄今为止全球规模最大的高光谱图像数据集。该数据集包含约45万张高光谱图像,规模等价于超过2000万张不重叠的三波段图像,远超现有的同类数据集。数据集涵盖了全球范围内的高光谱遥感图像,包括来自地球观测一号(EO-1)Hyperion和高分五号(GF-5B)两种传感器的图像,光谱范围从可见光到短波及中波红外,具有从紫外到长波红外的330个光谱波段,空间分辨率为30米。每幅图像经过精心处理,去除了无效波段和水汽吸收波段,保留了具有实际应用价值的光谱信息。HyperGlobal-450K数据集不仅支持高光谱图像的基础研究,还能够用于开发和测试各种高光谱图像处理方法,比如图像分类、目标检测、异常检测、变化检测、光谱解混、图像去噪和超分辨率等任务。

github 收录

THUCNews

THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。

github 收录