Breakfast Action Dataset|动作识别数据集|视频分析数据集

github2023-09-03 更新2024-05-31 收录

动作识别

视频分析

下载链接：

https://github.com/cantonioupao/pytorch-human_action_recognition_breakfast_dataset-C3D_model_implementation

下载链接

链接失效反馈

资源简介：

该数据集用于视频中人类动作的识别，包含了多种早餐制作动作的视频数据，数据集经过预处理后，视频被转换为帧并根据48种动作进行分类。

This dataset is designed for the recognition of human actions in videos, encompassing a variety of breakfast preparation activities. The dataset has been preprocessed, with videos converted into frames and categorized according to 48 distinct actions.

创建时间：

2019-03-21

AI搜集汇总

数据集介绍

构建方式

Breakfast Action Dataset的构建方式主要通过从Serre Lab获取原始视频数据，并进行预处理。原始数据包括多个参与者在不同场景下的视频，每个视频对应特定的动作标签。预处理步骤包括将视频帧提取为图像，并根据动作类别进行分类存储。最终的数据集结构按动作类别组织，每个类别下包含多个视频帧序列，便于后续的模型训练和评估。

特点

Breakfast Action Dataset的主要特点在于其丰富的动作类别和高分辨率的视频帧。该数据集涵盖了48种不同的动作，且每个动作由多个视频片段组成，确保了数据的多样性和代表性。此外，数据集经过精细的预处理，视频帧按动作类别分类存储，便于模型直接使用。

使用方法

使用Breakfast Action Dataset时，首先需下载并配置数据集路径，确保数据集结构与模型要求一致。接着，用户可通过修改train.py文件中的超参数（如batch_size、epoch数等）来训练模型。训练过程中，可通过TensorBoard实时监控训练进度和结果。训练完成后，用户可使用inference.py对新视频进行动作识别，输出概率最高的动作类别。

背景与挑战

背景概述

Breakfast Action Dataset（早餐动作数据集）由Serre Lab于2014年创建，旨在解决视频中人类动作识别的复杂问题。该数据集包含了48种不同的动作类别，涵盖了日常生活中的多种行为，如烹饪、饮食等。其核心研究问题是如何在复杂场景中准确识别和分类人类动作，尤其是在多变的光照条件和不同的视角下。该数据集的发布对视频动作识别领域产生了深远影响，为研究人员提供了一个标准化的基准，推动了深度学习模型在该领域的应用和发展。

当前挑战

Breakfast Action Dataset在构建和应用过程中面临多项挑战。首先，数据集包含的动作类别多样且复杂，涵盖了从简单的搅拌到复杂的烹饪步骤，这要求模型具备高度的泛化能力。其次，视频数据的多变性，包括不同的光照条件、视角变化和背景噪声，增加了动作识别的难度。此外，数据集的预处理过程也面临挑战，如视频帧的提取、标注的准确性以及数据集的分割等。这些挑战共同构成了该数据集在实际应用中的主要障碍。

常用场景

经典使用场景

Breakfast Action Dataset 主要用于视频中人类动作识别的研究，特别是在早餐场景下的动作分类。该数据集包含了多种早餐制作过程中的动作视频，如搅拌牛奶、煮咖啡、煎蛋等，为研究人员提供了丰富的动作样本。通过使用该数据集，研究者可以训练和验证动作识别模型，特别是在复杂场景下的动作分类任务中表现出色。

实际应用

Breakfast Action Dataset 在实际应用中具有广泛的应用前景，特别是在智能家居、视频监控和机器人技术领域。例如，该数据集可以用于训练智能家居系统，使其能够识别和响应用户的早餐制作动作，从而提供个性化的服务。此外，在视频监控中，该数据集可以帮助识别异常行为，提升安全监控的效率。

衍生相关工作

基于 Breakfast Action Dataset，许多研究者开发了多种动作识别模型，如 C3D 模型，并在该数据集上进行了验证。这些模型不仅提升了动作识别的准确性，还推动了视频理解技术的发展。此外，该数据集还激发了其他相关研究，如多模态动作识别和跨场景动作迁移等，进一步扩展了动作识别的研究领域。

以上内容由AI搜集并总结生成

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4098个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

中国逐日降水数据集（1961-2022，0.1°/0.25°/0.5°）

CHM_PRE数据集基于中国境内及周边1961至今共2839个站点的日降水观测，在传统的“降水背景场 + 降水比值场”的数据集构建思路上，尝试应用月值降水约束和地形特征校正，并依据中国范围内约4万个高密度站点2015–2019年的日降水量插值后数据进行精度评价。经评估认为，CHM_PRE可以较好的表征降水的空间变异性，其日值时间序列与高密度站点日值降水观测结果之间的相关系数中位数为0.78，均方根误差中位数为8.8 mm/d，KGE值中位数为0.69，与目前常用的降水数据集（CGDPA、CN05.1、CMA V2.0）有很好的一致性。数据集的时间范围为1961年至今，空间分辨率为0.1°、0.25°和0.5°，经纬度范围为18°N–54°N, 72°E–136°E。

国家青藏高原科学数据中心收录

MedChain

MedChain是由香港城市大学、香港中文大学、深圳大学、阳明交通大学和台北荣民总医院联合创建的临床决策数据集，包含12,163个临床案例，涵盖19个医学专科和156个子类别。数据集通过五个关键阶段模拟临床工作流程，强调个性化、互动性和顺序性。数据来源于中国医疗网站“iiYi”，经过专业医生验证和去识别化处理，确保数据质量和患者隐私。MedChain旨在评估大型语言模型在真实临床场景中的诊断能力，解决现有基准在个性化医疗、互动咨询和顺序决策方面的不足。

arXiv 收录

Plant-Diseases

Dataset for Plant Diseases containg variours Plant Disease

kaggle 收录

THCHS-30

“THCHS30是由清华大学语音与语言技术中心（CSLT）发布的开放式汉语语音数据库。原始录音是2002年在清华大学国家重点实验室的朱晓燕教授的指导下，由王东完成的。清华大学计算机科学系智能与系统，原名“TCMSD”，意思是“清华连续普通话语音数据库”，时隔13年出版，由王东博士发起，并得到了教授的支持。朱小燕。我们希望为语音识别领域的新研究人员提供一个玩具数据库。因此，该数据库对学术用户完全免费。整个软件包包含建立中文语音识别所需的全套语音和语言资源系统。”

OpenDataLab 收录

长江干流实时水位观测数据集（2024年）

该数据集为长江干流主要水文站实时水位观测数据集，包含了汉口、户口、九江、宜昌等16个水文站点的逐小时或逐日水位观测数据。该数据集包含3个excel表格文件，长江干流站点.xls，逐日水位.xlsx，逐小时水位.xlsx。

国家地球系统科学数据中心收录