five

OpenGVLab/MMT-Bench

收藏
hugging_face2024-06-24 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/OpenGVLab/MMT-Bench
下载链接
链接失效反馈
资源简介:
MMT-Bench是一个全面的多模态基准测试数据集,旨在评估大型视觉语言模型(LVLMs)在需要专家知识和视觉识别、定位及推理的多模态任务中的表现。该数据集包含31,325个精心策划的多项选择视觉问题,涵盖了32个核心元任务和162个子任务,涉及车辆驾驶和具身导航等多种多模态场景。数据集分为四个文件,分别用于本地模型评估和服务器评估,并提供了处理多图像任务的不同方式。

MMT-Bench是一个全面的多模态基准测试数据集,旨在评估大型视觉语言模型(LVLMs)在需要专家知识和视觉识别、定位及推理的多模态任务中的表现。该数据集包含31,325个精心策划的多项选择视觉问题,涵盖了32个核心元任务和162个子任务,涉及车辆驾驶和具身导航等多种多模态场景。数据集分为四个文件,分别用于本地模型评估和服务器评估,并提供了处理多图像任务的不同方式。
提供机构:
OpenGVLab
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

MOOCs Dataset

该数据集包含了大规模开放在线课程(MOOCs)的相关数据,包括课程信息、用户行为、学习进度等。数据主要用于研究在线教育的行为模式和学习效果。

www.kaggle.com 收录

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

NuminaMath-CoT

数据集包含约86万道数学题目,每道题目的解答都采用思维链(Chain of Thought, CoT)格式。数据来源包括中国高中数学练习题以及美国和国际数学奥林匹克竞赛题目。数据主要从在线考试试卷PDF和数学讨论论坛收集。处理步骤包括从原始PDF中进行OCR识别、分割成问题-解答对、翻译成英文、重新对齐以生成CoT推理格式,以及最终答案格式化。

huggingface 收录