ETDataset/ett|电力变压器数据集|时间序列预测数据集
收藏数据集概述
数据集基本信息
- 名称: Electricity Transformer Temperature
- 许可证: CC BY 4.0
- 语言多样性: 单语种
- 大小分类: 1K<n<10K
- 源数据: 原始数据
- 任务类别: 时间序列预测
- 任务ID:
- 单变量时间序列预测
- 多变量时间序列预测
数据集结构
配置信息
-
h1
- 特征:
start: 时间戳[s]target: 序列, float32feat_static_cat: 序列, uint64feat_dynamic_real: 序列, 序列, float32item_id: 字符串
- 分割:
train: 241978字节, 1个样本test: 77508960字节, 240个样本validation: 33916080字节, 120个样本
- 下载大小: 2589657字节
- 数据集大小: 111667018字节
- 特征:
-
h2
- 特征:
start: 时间戳[s]target: 序列, float32feat_static_cat: 序列, uint64feat_dynamic_real: 序列, 序列, float32item_id: 字符串
- 分割:
train: 241978字节, 1个样本test: 77508960字节, 240个样本validation: 33916080字节, 120个样本
- 下载大小: 2417960字节
- 数据集大小: 111667018字节
- 特征:
-
m1
- 特征:
start: 时间戳[s]target: 序列, float32feat_static_cat: 序列, uint64feat_dynamic_real: 序列, 序列, float32item_id: 字符串
- 分割:
train: 967738字节, 1个样本test: 1239008640字节, 960个样本validation: 542089920字节, 480个样本
- 下载大小: 10360719字节
- 数据集大小: 1782066298字节
- 特征:
-
m2
- 特征:
start: 时间戳[s]target: 序列, float32feat_static_cat: 序列, uint64feat_dynamic_real: 序列, 序列, float32item_id: 字符串
- 分割:
train: 967738字节, 1个样本test: 1239008640字节, 960个样本validation: 542089920字节, 480个样本
- 下载大小: 9677236字节
- 数据集大小: 1782066298字节
- 特征:
数据集描述
数据集摘要
该数据集包含两年的电力变压器温度数据,数据频率为每小时或每15分钟一次。目标时间序列是油温,数据集包含以下六个协变量:
- 高有效负载
- 高无效负载
- 中有效负载
- 中无效负载
- 低有效负载
- 低无效负载
数据集使用
加载特定变体的数据集示例: python load_dataset("ett", "m1", multivariate=False) # 单变量15分钟频率数据集,来自第一个变压器
或指定预测长度: python load_dataset("ett", "h2", prediction_length=48) # 多变量数据集,来自第二个变压器,预测长度为48小时
支持的任务和排行榜
时间序列数据被分为训练/验证/测试集,分别为12/4/4个月。给定预测长度(默认:1天,24小时或24*4 15分钟),我们为验证/测试集创建滚动窗口。
时间序列预测
- 单变量时间序列预测: 学习数据集中时间序列的未来一维
target值,预测未来prediction_length时间步的值。 - 多变量时间序列预测: 学习数据集中时间序列的未来向量
target值,预测未来prediction_length时间步的值。

Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录
National Center for Education Statistics (NCES) - Integrated Postsecondary Education Data System (IPEDS)
IPEDS是一个综合性的高等教育数据系统,由美国国家教育统计中心(NCES)维护。该数据集涵盖了美国高等教育机构的广泛信息,包括学生入学、毕业率、财务状况、教师信息、课程设置等。数据每年更新,为政策制定者、研究人员和公众提供关于美国高等教育状况的全面数据。
nces.ed.gov 收录
PlantVillage
在这个数据集中,39 种不同类别的植物叶子和背景图像可用。包含 61,486 张图像的数据集。我们使用了六种不同的增强技术来增加数据集的大小。这些技术是图像翻转、伽玛校正、噪声注入、PCA 颜色增强、旋转和缩放。
OpenDataLab 收录
PASCAL VOC 2007
这个挑战的目标是从现实场景中的许多视觉对象类别中识别对象(即不是预先分割的对象)。它基本上是一个监督学习问题,因为它提供了一组标记图像的训练集。已选择的 20 个对象类别是: 人:人 动物:鸟、猫、牛、狗、马、羊 交通工具:飞机、自行车、船、公共汽车、汽车、摩托车、火车 室内:瓶子、椅子、餐桌、盆栽、沙发、电视/显示器 将有两个主要比赛和两个较小规模的“品酒师”比赛。内容:提供的训练数据由一组图像组成;每个图像都有一个注释文件,为图像中存在的 20 个类别之一中的每个对象提供一个边界框和对象类别标签。请注意,来自多个类的多个对象可能出现在同一图像中。
OpenDataLab 收录
