five

3DYoga90|瑜伽动作识别数据集|姿态评估数据集

收藏
arXiv2023-10-16 更新2024-06-21 收录
瑜伽动作识别
姿态评估
下载链接:
https://github.com/seonokkim/3DYoga90
下载链接
链接失效反馈
资源简介:
3DYoga90是由韩国大学开发的一个全面开放的瑜伽动作识别和姿态评估数据集。该数据集包含90种不同的瑜伽姿势,分为三个级别的标签层次结构,涵盖了RGB视频和3D骨骼序列。数据集通过精心筛选的YouTube视频和专业瑜伽教练的参与创建,旨在推动瑜伽动作识别技术的研究和发展。
提供机构:
韩国大学
创建时间:
2023-10-16
AI搜集汇总
数据集介绍
main_image_url
构建方式
3DYoga90数据集的构建,首先由一个由六人组成的团队,包括三名瑜伽教练,精心收集和整理了来自YouTube的RGB瑜伽姿势视频和3D骨架序列。为了确保数据的多样性和覆盖面,团队在2023年6月至7月期间,使用英语、韩语、梵语等多种语言进行搜索,收集了30分钟以内的原始视频,并从中提取了30秒内的目标姿势片段。此外,数据集采用了三级的标签层次结构,其中第一级和第二级与Yoga-82数据集保持一致,而第三级则新增了九个姿势,使得数据集更加全面和细致。
特点
3DYoga90数据集具有以下几个显著特点:首先,它包含90个不同的瑜伽姿势,是目前为止最大的瑜伽姿势视频数据集。其次,该数据集采用了三级的标签层次结构,使得分类更加细致和精确。第三,数据集由RGB瑜伽姿势视频和3D骨架序列组成,提供了丰富的数据类型,有助于提高模型的识别和评估能力。最后,3DYoga90数据集是目前公开资源中最大的RGB视频和3D骨架序列集合,为瑜伽动作识别和姿势评估的研究提供了宝贵的资源。
使用方法
使用3DYoga90数据集的方法主要包括以下步骤:首先,从GitHub下载数据集和代码。然后,使用数据集中的RGB视频和3D骨架序列进行模型训练。在训练过程中,可以采用三种不同的DNN模型变体进行基准测试,以评估模型的性能。最后,根据实验结果,可以进一步优化模型结构和参数,以提高模型的识别和评估能力。
背景与挑战
背景概述
随着瑜伽和普拉提等锻炼形式的日益流行,人工智能领域对专业锻炼视频数据集的需求日益增长。本研究中,我们开发了3DYoga90数据集,它采用三层标签层次结构组织。我们扩展了现有最先进数据集中的姿势数量,从82个增加到90个。我们的数据集包括精心策划的RGB瑜伽姿势视频和3D骨架序列。这个数据集由一个由六人组成的专门团队创建,包括瑜伽教练。它作为最全面的公开数据集之一,在公开资源中拥有最大的RGB视频和3D骨架序列集合。这一贡献有可能极大地推动瑜伽动作识别和姿势评估领域的发展。此外,我们还进行了实验以评估我们提出的实际数据集的实用性。我们使用了三种不同的模型变体进行基准测试。
当前挑战
1)所解决的领域问题的挑战:瑜伽姿势识别的挑战在于其涉及连续运动范围广泛的动作,即使在单个姿势内也是如此。因此,对能够捕获这些微妙动作单元的全面数据集的需求日益明显。然而,目前显然缺乏提供细粒度类别的公开视频数据集,这些类别适用于有效的模型训练。2)构建过程中所遇到的挑战:数据不足的问题有两个主要因素:需要特定领域的专业知识,以及网络上可用的数据稀缺。我们通过招募三名瑜伽教练来确保姿势分类和数据收集的精确性来应对这些挑战。为了增强数据多样性,我们在包括英语、韩语、日语、梵语在内的多种语言中进行了搜索。我们还利用了现有的网络视频,如YouTube,来构建数据集,这带来了数据版权和访问权限的问题。
常用场景
经典使用场景
3DYoga90数据集在瑜伽动作识别和姿势评估领域中的应用至关重要。该数据集提供了一个丰富的资源,包含了90种不同的瑜伽姿势,并且组织成了一个三层标签层次结构。研究人员可以利用这个数据集来训练和评估各种深度学习模型,以实现瑜伽动作的自动识别和姿势的精确评估。此外,3DYoga90数据集还可以用于研究不同瑜伽姿势对身体的影响,以及如何通过瑜伽动作来提高健康和福祉。
解决学术问题
3DYoga90数据集解决了瑜伽动作识别和姿势评估领域中的几个常见问题。首先,它提供了一个大规模的瑜伽动作数据集,克服了之前数据集规模较小的问题。其次,它包含了精细的标签层次结构,使得研究人员可以更精确地进行瑜伽动作分类。最后,它提供了RGB视频和3D骨架序列数据,使得研究人员可以同时利用图像和骨架信息来进行瑜伽动作识别和姿势评估。这些贡献对于推动瑜伽动作识别和姿势评估领域的发展具有重要意义。
衍生相关工作
3DYoga90数据集的发布推动了瑜伽动作识别和姿势评估领域的研究进展。基于3DYoga90数据集,研究人员开发了许多相关的经典工作,包括瑜伽动作识别算法、姿势评估模型和智能瑜伽教练系统等。这些研究工作为瑜伽动作识别和姿势评估领域的发展提供了重要的基础和启示。此外,3DYoga90数据集的发布还促进了跨学科的研究,例如将瑜伽动作识别技术应用于其他领域,如舞蹈动作识别、体育动作识别等。这些研究工作为瑜伽动作识别和姿势评估领域的发展带来了新的机遇和挑战。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

中国气象数据

本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。

github 收录

猫狗图像数据集

该数据集包含猫和狗的图像,每类各12500张。训练集和测试集分别包含10000张和2500张图像,用于模型的训练和评估。

github 收录

MedDialog

MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。

github 收录

UniMed

UniMed是一个大规模、开源的多模态医学数据集,包含超过530万张图像-文本对,涵盖六种不同的医学成像模态:X射线、CT、MRI、超声、病理学和眼底。该数据集通过利用大型语言模型(LLMs)将特定模态的分类数据集转换为图像-文本格式,并结合现有的医学领域的图像-文本数据,以促进可扩展的视觉语言模型(VLM)预训练。

github 收录