five

3DYoga90|瑜伽动作识别数据集|姿态评估数据集

收藏
arXiv2023-10-16 更新2024-06-21 收录
瑜伽动作识别
姿态评估
下载链接:
https://github.com/seonokkim/3DYoga90
下载链接
链接失效反馈
资源简介:
3DYoga90是由韩国大学开发的一个全面开放的瑜伽动作识别和姿态评估数据集。该数据集包含90种不同的瑜伽姿势,分为三个级别的标签层次结构,涵盖了RGB视频和3D骨骼序列。数据集通过精心筛选的YouTube视频和专业瑜伽教练的参与创建,旨在推动瑜伽动作识别技术的研究和发展。
提供机构:
韩国大学
创建时间:
2023-10-16
AI搜集汇总
数据集介绍
main_image_url
构建方式
3DYoga90数据集的构建,首先由一个由六人组成的团队,包括三名瑜伽教练,精心收集和整理了来自YouTube的RGB瑜伽姿势视频和3D骨架序列。为了确保数据的多样性和覆盖面,团队在2023年6月至7月期间,使用英语、韩语、梵语等多种语言进行搜索,收集了30分钟以内的原始视频,并从中提取了30秒内的目标姿势片段。此外,数据集采用了三级的标签层次结构,其中第一级和第二级与Yoga-82数据集保持一致,而第三级则新增了九个姿势,使得数据集更加全面和细致。
特点
3DYoga90数据集具有以下几个显著特点:首先,它包含90个不同的瑜伽姿势,是目前为止最大的瑜伽姿势视频数据集。其次,该数据集采用了三级的标签层次结构,使得分类更加细致和精确。第三,数据集由RGB瑜伽姿势视频和3D骨架序列组成,提供了丰富的数据类型,有助于提高模型的识别和评估能力。最后,3DYoga90数据集是目前公开资源中最大的RGB视频和3D骨架序列集合,为瑜伽动作识别和姿势评估的研究提供了宝贵的资源。
使用方法
使用3DYoga90数据集的方法主要包括以下步骤:首先,从GitHub下载数据集和代码。然后,使用数据集中的RGB视频和3D骨架序列进行模型训练。在训练过程中,可以采用三种不同的DNN模型变体进行基准测试,以评估模型的性能。最后,根据实验结果,可以进一步优化模型结构和参数,以提高模型的识别和评估能力。
背景与挑战
背景概述
随着瑜伽和普拉提等锻炼形式的日益流行,人工智能领域对专业锻炼视频数据集的需求日益增长。本研究中,我们开发了3DYoga90数据集,它采用三层标签层次结构组织。我们扩展了现有最先进数据集中的姿势数量,从82个增加到90个。我们的数据集包括精心策划的RGB瑜伽姿势视频和3D骨架序列。这个数据集由一个由六人组成的专门团队创建,包括瑜伽教练。它作为最全面的公开数据集之一,在公开资源中拥有最大的RGB视频和3D骨架序列集合。这一贡献有可能极大地推动瑜伽动作识别和姿势评估领域的发展。此外,我们还进行了实验以评估我们提出的实际数据集的实用性。我们使用了三种不同的模型变体进行基准测试。
当前挑战
1)所解决的领域问题的挑战:瑜伽姿势识别的挑战在于其涉及连续运动范围广泛的动作,即使在单个姿势内也是如此。因此,对能够捕获这些微妙动作单元的全面数据集的需求日益明显。然而,目前显然缺乏提供细粒度类别的公开视频数据集,这些类别适用于有效的模型训练。2)构建过程中所遇到的挑战:数据不足的问题有两个主要因素:需要特定领域的专业知识,以及网络上可用的数据稀缺。我们通过招募三名瑜伽教练来确保姿势分类和数据收集的精确性来应对这些挑战。为了增强数据多样性,我们在包括英语、韩语、日语、梵语在内的多种语言中进行了搜索。我们还利用了现有的网络视频,如YouTube,来构建数据集,这带来了数据版权和访问权限的问题。
常用场景
经典使用场景
3DYoga90数据集在瑜伽动作识别和姿势评估领域中的应用至关重要。该数据集提供了一个丰富的资源,包含了90种不同的瑜伽姿势,并且组织成了一个三层标签层次结构。研究人员可以利用这个数据集来训练和评估各种深度学习模型,以实现瑜伽动作的自动识别和姿势的精确评估。此外,3DYoga90数据集还可以用于研究不同瑜伽姿势对身体的影响,以及如何通过瑜伽动作来提高健康和福祉。
解决学术问题
3DYoga90数据集解决了瑜伽动作识别和姿势评估领域中的几个常见问题。首先,它提供了一个大规模的瑜伽动作数据集,克服了之前数据集规模较小的问题。其次,它包含了精细的标签层次结构,使得研究人员可以更精确地进行瑜伽动作分类。最后,它提供了RGB视频和3D骨架序列数据,使得研究人员可以同时利用图像和骨架信息来进行瑜伽动作识别和姿势评估。这些贡献对于推动瑜伽动作识别和姿势评估领域的发展具有重要意义。
衍生相关工作
3DYoga90数据集的发布推动了瑜伽动作识别和姿势评估领域的研究进展。基于3DYoga90数据集,研究人员开发了许多相关的经典工作,包括瑜伽动作识别算法、姿势评估模型和智能瑜伽教练系统等。这些研究工作为瑜伽动作识别和姿势评估领域的发展提供了重要的基础和启示。此外,3DYoga90数据集的发布还促进了跨学科的研究,例如将瑜伽动作识别技术应用于其他领域,如舞蹈动作识别、体育动作识别等。这些研究工作为瑜伽动作识别和姿势评估领域的发展带来了新的机遇和挑战。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Figshare

Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。

figshare.com 收录

jpft/danbooru2023

Danbooru2023是一个大规模的动漫图像数据集,包含超过500万张由爱好者社区贡献并详细标注的图像。图像标签涵盖角色、场景、版权、艺术家等方面,平均每张图像有30个标签。该数据集可用于训练图像分类、多标签标注、角色检测、生成模型等多种计算机视觉任务。数据集基于danbooru2021构建,扩展至包含ID #6,857,737的图像,增加了超过180万张新图像,总大小约为8TB。图像以原始格式提供,分为1000个子目录,使用图像ID的模1000进行分桶,以避免文件系统性能问题。

hugging_face 收录

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

Comparative Toxicogenomics Database (CTD)

Comparative Toxicogenomics Database(CTD)是一个公开的综合性数据库,专注于研究环境暴露与人类健康之间的关系。该数据库整合了化学物质、基因、疾病、通路等多维度信息,支持用户查询基因与疾病、化学物质与疾病以及化学物质与基因之间的相互作用,为毒理学研究和环境健康效应研究提供了重要资源。其最新成果包括2025年发布的20周年更新版本,进一步扩展了数据内容和功能。

ctdbase.org 收录

Apple Stock Price Data

Historical stock price data for AAPL (apple)

kaggle 收录