MELD|情感识别数据集|多模态数据分析数据集

OpenDataLab2025-04-05 更新2024-05-09 收录

情感识别

多模态数据分析

下载链接：

https://opendatalab.org.cn/OpenDataLab/MELD

下载链接

链接失效反馈

资源简介：

多模态情感线数据集 (MELD) 是通过增强和扩展情感线数据集创建的。MELD包含与情感线相同的对话实例，但它也包含音频和视觉模态以及文本。MELD有1400多个对话和朋友电视剧的13000话语。多位发言者参加了对话。对话中的每句话都被这七种情绪中的任何一种标记-愤怒，厌恶，悲伤，喜悦，中立，惊讶和恐惧。MELD还为每个话语提供情感 (正面，负面和中立) 注释。

提供机构：

OpenDataLab

创建时间：

2023-01-13

AI搜集汇总

数据集介绍

构建方式

MELD数据集源自于多模态情感分析领域，其构建基于著名的电视剧对话数据集Friends。研究者们通过精细的手工标注，将原始对话数据中的情感状态细分为七种基本情感类别，包括愤怒、厌恶、恐惧、喜悦、悲伤、惊讶和中性。此外，数据集还包含了对话的上下文信息，以捕捉情感在连续对话中的动态变化。这种多层次的标注方式使得MELD成为情感分析研究中的重要资源。

特点

MELD数据集的显著特点在于其多模态和多层次的情感标注。除了文本信息外，数据集还整合了音频和视频数据，提供了丰富的情感表达线索。此外，MELD的情感标注不仅限于单个对话片段，而是扩展到整个对话序列，使得研究者能够探索情感在对话中的演变过程。这种全面性和细致性使得MELD在多模态情感分析领域具有独特的优势。

使用方法

MELD数据集适用于多种情感分析任务，包括但不限于情感分类、情感演变分析和多模态情感识别。研究者可以通过预处理文本、音频和视频数据，提取特征并训练模型。例如，可以使用深度学习模型如LSTM或BERT来处理文本数据，结合卷积神经网络（CNN）处理音频和视频数据，以实现多模态情感分析。此外，MELD的对话上下文信息也为研究情感动态提供了丰富的数据支持。

背景与挑战

背景概述

MELD（Multimodal EmotionLines Dataset）数据集于2018年由南加州大学和卡内基梅隆大学的研究人员共同创建，旨在推动情感识别领域的研究。该数据集基于情感对话数据集EmotionLines，通过整合音频、视频和文本等多模态信息，提供了一个更为全面和复杂的情感分析平台。MELD的核心研究问题是如何在多模态环境下准确识别和分类对话中的情感状态，这对于人机交互、情感计算和心理健康监测等领域具有重要意义。其发布后，迅速成为情感识别研究中的重要基准，推动了多模态情感分析技术的发展。

当前挑战

MELD数据集在构建和应用过程中面临多项挑战。首先，多模态数据的整合与同步要求高精度的数据处理技术，以确保各模态信息的一致性和有效性。其次，情感识别的准确性受限于数据集的情感标签多样性和样本分布的平衡性，如何处理情感标签的模糊性和样本不均衡问题是一大挑战。此外，跨模态特征提取和融合技术的复杂性也增加了研究的难度。最后，数据集的实际应用场景多样，如何在不同场景下保持情感识别的高效性和准确性，是未来研究的重要方向。

发展历史

创建时间与更新

MELD数据集于2018年首次发布，由南加州大学和卡内基梅隆大学的研究团队共同创建。该数据集在2019年进行了首次更新，增加了更多的情感标注和对话片段，以提升其在情感识别任务中的应用价值。

重要里程碑

MELD数据集的发布标志着多模态情感识别领域的一个重要里程碑。其首次引入的多模态数据（包括文本、音频和视频）为情感分析提供了更为丰富的信息源，极大地推动了相关研究的发展。此外，MELD数据集在2019年的更新中，不仅增加了数据量，还引入了更为精细的情感类别标注，进一步提升了其在学术研究和实际应用中的影响力。

当前发展情况

当前，MELD数据集已成为情感计算和多模态数据分析领域的重要基准。其在多个国际会议和期刊上被广泛引用，推动了情感识别算法的创新和性能提升。同时，MELD数据集的应用也扩展到了人机交互、心理健康监测等多个实际场景，为相关领域的技术进步和应用落地提供了坚实的基础。未来，随着更多研究者和开发者的参与，MELD数据集有望继续引领情感识别技术的发展方向。

发展历程

MELD数据集首次发表，由S. Poria等人提出，旨在为多模态情感分析提供一个标准化的数据集。
2018年
MELD数据集首次应用于多模态情感识别任务，展示了其在情感分析领域的潜力。
2019年
MELD数据集被广泛应用于多个研究项目，成为多模态情感分析领域的重要基准数据集。
2020年
MELD数据集的扩展版本发布，增加了更多的情感类别和多模态数据，进一步提升了其在情感分析中的应用价值。
2021年

常用场景

经典使用场景

在情感分析领域，MELD数据集以其丰富的多模态情感和情绪标注而著称。该数据集源自多轮对话系统，包含对话中的文本、音频和视频信息，为研究者提供了多层次的情感分析素材。经典使用场景包括情感识别、情绪分类以及多模态情感融合研究，这些应用场景极大地推动了情感计算技术的发展。

解决学术问题

MELD数据集解决了情感分析领域中多模态数据融合的挑战。通过提供文本、音频和视频的多模态数据，该数据集帮助研究者探索如何在不同模态间建立有效的情感关联。这不仅提升了情感识别的准确性，还为多模态情感分析提供了新的研究方向，具有重要的学术价值和实际意义。

衍生相关工作

基于MELD数据集，研究者们开发了多种情感分析模型和算法，推动了多模态情感分析技术的发展。例如，有研究利用MELD数据集进行跨模态情感迁移学习，提升了模型的泛化能力。此外，MELD数据集还激发了关于情感动态变化的研究，探索如何在对话过程中捕捉和分析情感的演变，这些工作为情感计算领域带来了新的视角和方法。

以上内容由AI搜集并总结生成

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4098个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

Beijing Traffic

The Beijing Traffic Dataset collects traffic speeds at 5-minute granularity for 3126 roadway segments in Beijing between 2022/05/12 and 2022/07/25.

Papers with Code 收录

Solar Radiation Data

该数据集包含全球多个地点的太阳辐射数据，涵盖了不同时间段和气象条件下的辐射强度。数据包括直接辐射、散射辐射和总辐射等指标，适用于太阳能资源评估和气候研究。

www.nrel.gov 收录

FER2013

FER2013数据集是一个广泛用于面部表情识别领域的数据集，包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素，标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。

github 收录

NIST Thermochemical Database

NIST Thermochemical Database（NIST热化学数据库）是一个包含大量热化学数据的数据集，涵盖了各种化学物质的热力学性质，如焓、熵、自由能等。该数据库由美国国家标准与技术研究院（NIST）维护，旨在为科学研究和工业应用提供准确的热化学数据。

webbook.nist.gov 收录

Obstacle-dataset OD

该数据集用于十五种障碍物检测，包含VOC格式和YOLO训练的.txt文件，数据集中的图像来自VOC数据集、COCO数据集、TT100K数据集以及作者团队实地收集的图片。

github 收录