five

AIST-M|舞蹈生成数据集|动作分析数据集

收藏
github2024-05-07 更新2024-05-31 收录
舞蹈生成
动作分析
下载链接:
https://github.com/JJessicaYao/AIST-M-Dataset
下载链接
链接失效反馈
资源简介:
AIST-M是一个用于合作伙伴舞蹈生成的全新数据集,旨在控制领舞者和合作伙伴之间的姿势多样性,同时保持与领舞者的时序协调。数据集包含了多种格式的关键点数据,包括2D和3D关键点,以及SMPL格式的动作数据,用于支持舞蹈动作的生成和分析。

AIST-M is a novel dataset designed for partner dance generation, aiming to control the diversity of poses between the lead dancer and the partner while maintaining temporal coordination with the lead dancer. The dataset includes keypoint data in various formats, including 2D and 3D keypoints, as well as motion data in SMPL format, to support the generation and analysis of dance movements.
创建时间:
2023-05-11
AI搜集汇总
数据集介绍
main_image_url
构建方式
在构建AIST-M数据集时,研究团队首先通过3D姿态收集阶段,广泛采集基础舞蹈姿态作为运动生成的参考。随后,引入一个超参数,通过遮蔽姿态来协调舞者之间的相似性,以防止生成过于多样或一致的序列。为避免动作僵硬,设计了舞蹈预生成阶段,预先生成这些遮蔽姿态,而非填充零值。最后,通过舞蹈运动转移阶段,结合领导舞者的序列和音乐,重写多条件采样公式,将预生成的姿态转换为具有伙伴风格的序列。
特点
AIST-M数据集的主要特点在于其多样性和可控性。该数据集不仅包含了丰富的3D和2D姿态数据,还特别设计了领导舞者和伙伴舞者的配对数据,确保了舞蹈动作的多样性和协调性。此外,数据集还包含了从原始音乐文件中提取的音乐特征,这些特征与运动帧对齐,为舞蹈生成提供了音乐背景。
使用方法
使用AIST-M数据集时,首先需下载并解压数据集到指定文件夹。数据集的结构包括2D和3D关键点、SMPL姿态格式关键点、领导舞者和伙伴舞者的配对数据以及音乐特征。在训练过程中,需依次进行三个阶段的训练:3D姿态收集阶段、舞蹈预生成阶段和舞蹈运动转移阶段。每个阶段的训练代码和配置文件均提供,用户可根据需要进行微调或直接使用预训练模型。训练结果可用于定性和定量评估,评估代码也一并提供。
背景与挑战
背景概述
近年来,虚拟环境中的人际互动数字人类引起了广泛关注。在此背景下,AIST-M数据集应运而生,旨在支持一种新颖的多舞者合成任务,即合作伙伴舞者生成。该任务的核心在于合成能够与用户共舞的虚拟人类舞者,并控制主导舞者与合作伙伴舞者之间的姿态多样性。AIST-M数据集由Yao等人于2023年创建,作为ACM MM 2023会议论文《Dance with You: The Diversity Controllable Dancer Generation via Diffusion Models》的配套数据集。该数据集的构建旨在解决现有数据集在多舞者互动场景中的不足,为研究者提供了一个丰富的资源,以探索和实现舞者姿态的多样性与协调性的平衡。
当前挑战
AIST-M数据集在构建过程中面临多项挑战。首先,多舞者互动场景的数据收集与标注复杂度较高,需要确保舞者姿态的多样性与协调性。其次,数据集的多样性控制要求在生成合作伙伴舞者时,既能保持与主导舞者的协调性,又能实现多样化的姿态生成,这对算法的设计提出了高要求。此外,数据集的构建还需考虑音乐与舞者动作的同步性,确保生成的舞者动作与音乐节奏相匹配。最后,数据集的评估方法需要综合考虑定性与定量指标,以全面评价生成舞者的质量与多样性。
常用场景
经典使用场景
AIST-M数据集在舞蹈生成领域中,主要用于合成具有多样性可控性的舞伴舞蹈。通过该数据集,研究者可以训练模型生成与主导舞者协调且多样化的舞伴动作,从而实现虚拟环境中的人际互动。这一应用场景不仅扩展了舞蹈生成的研究边界,还为虚拟现实和数字人技术提供了新的可能性。
解决学术问题
AIST-M数据集解决了在舞蹈生成中如何控制舞伴动作多样性的学术问题。传统舞蹈生成研究多聚焦于音乐驱动的单人舞蹈,而AIST-M则强调在保持时间协调性的同时,生成与主导舞者动作多样性可控的舞伴动作。这一创新不仅提升了舞蹈生成的真实感和互动性,还为相关领域的研究提供了新的思路和方法。
衍生相关工作
基于AIST-M数据集,研究者们开发了多种舞蹈生成模型,如DanY框架,该框架通过三阶段处理实现了舞伴动作的多样性控制。此外,AIST-M还激发了在舞蹈生成中引入音乐特征的研究,进一步提升了生成动作的自然度和协调性。这些衍生工作不仅丰富了舞蹈生成领域的研究内容,还推动了相关技术的实际应用。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

ROBEL

ROBEL是一个开源的低成本机器人平台,专为现实世界的强化学习设计。该平台由谷歌研究院和加州大学伯克利分校共同开发,包含两个机器人:D'Claw,一个三指手机器人,用于促进精细操作任务的学习;D'Kitty,一个四足机器人,用于促进敏捷的腿式移动任务学习。这些模块化机器人易于维护且足够坚固,能够承受从零开始的硬件强化学习,目前已记录超过14000小时的训练时间。ROBEL提供了一系列连续控制基准任务,这些任务具有密集和稀疏的任务目标,并引入了硬件安全评分指标。数据集和相关材料可在www.roboticsbenchmarks.org访问,旨在解决强化学习在真实机器人上的应用问题,特别是在处理物理限制和环境交互方面的挑战。

arXiv 收录

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

中国交通事故深度调查(CIDAS)数据集

交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、

北方大数据交易中心 收录

YOLO Drone Detection Dataset

为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。

github 收录

中国空气质量数据集(2014-2020年)

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心 收录