MUIRBENCH|问答数据集|视觉问答数据集
收藏MuirBench 数据集概述
基本信息
- 语言: 英语
- 许可: CC-BY-4.0
- 数据规模: 1K<n<10K
- 任务类别:
- 问答
- 视觉问答
- 多选题
- 数据集名称: MuirBench
数据集详情
- 特征:
idx
: 字符串task
: 字符串image_relation
: 字符串image_type
: 字符串question
: 字符串options
: 字符串序列answer
: 字符串image_list
: 图像序列counterpart_idx
: 字符串
- 分割:
test
: 2600个样本,2280382684.8字节
- 下载大小: 429440985字节
- 数据集大小: 2280382684.8字节
配置
- 配置名称: default
- 数据文件:
split
: testpath
: data/test-*
- 数据文件:
数据集介绍
- 包含图像数量: 11,264张
- 包含问题数量: 2,600个多选题
- 评估任务: 12种多图像理解任务
- 图像关系: 10种多样化的多图像关系
- 不可回答实例: 通过三种主要方式创建不可回答实例,以提供模型鲁棒性评估
评估结果
- 评估模型: 20个近期多模态大型语言模型(LLMs)
- 最佳模型表现: GPT-4o和Gemini Pro分别达到68.0%和49.3%的准确率
- 开源模型表现: 基于单图像训练的多模态LLMs在多图像问题上准确率低于33.3%

中国空气质量数据集(2014-2020年)
数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。
国家地球系统科学数据中心 收录
ROBEL
ROBEL是一个开源的低成本机器人平台,专为现实世界的强化学习设计。该平台由谷歌研究院和加州大学伯克利分校共同开发,包含两个机器人:D'Claw,一个三指手机器人,用于促进精细操作任务的学习;D'Kitty,一个四足机器人,用于促进敏捷的腿式移动任务学习。这些模块化机器人易于维护且足够坚固,能够承受从零开始的硬件强化学习,目前已记录超过14000小时的训练时间。ROBEL提供了一系列连续控制基准任务,这些任务具有密集和稀疏的任务目标,并引入了硬件安全评分指标。数据集和相关材料可在www.roboticsbenchmarks.org访问,旨在解决强化学习在真实机器人上的应用问题,特别是在处理物理限制和环境交互方面的挑战。
arXiv 收录
NuminaMath-CoT
数据集包含约86万道数学题目,每道题目的解答都采用思维链(Chain of Thought, CoT)格式。数据来源包括中国高中数学练习题以及美国和国际数学奥林匹克竞赛题目。数据主要从在线考试试卷PDF和数学讨论论坛收集。处理步骤包括从原始PDF中进行OCR识别、分割成问题-解答对、翻译成英文、重新对齐以生成CoT推理格式,以及最终答案格式化。
huggingface 收录
THUCNews
THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。
github 收录
Solar Radiation Data
该数据集包含全球多个地点的太阳辐射数据,涵盖了不同时间段和气象条件下的辐射强度。数据包括直接辐射、散射辐射和总辐射等指标,适用于太阳能资源评估和气候研究。
www.nrel.gov 收录