five

digital-twin-dataset|数字孪生数据集|电力系统数据集

收藏
github2025-01-09 更新2025-01-10 收录
数字孪生
电力系统
下载链接:
https://github.com/caltech-netlab/digital-twin-dataset
下载链接
链接失效反馈
资源简介:
该数据集包含从美国合作伙伴收集的数据,数据已匿名化处理以移除所有地理标识符。数据集包含三种时间序列数据以及电路拓扑数据,具体包括电流和电压的均方根值、同步相量测量和原始点波测量。
创建时间:
2025-01-04
原始信息汇总

数据集概述

数据集来源

该数据集包含从美国合作伙伴配电系统运营商收集的数据,数据已匿名化处理,删除了所有地理标识符。

数据集样本

完整数据集

数据类型

数据集包含以下四种类型的数据:

1. 幅值数据 (sample_data/magnitude)

  • 内容: 包含电流和电压的均方根幅值,不包含相位角信息。
  • 采样间隔: 1秒

2. 同步相量数据 (sample_data/phasor)

  • 内容: 包含同步相量测量数据,以复数形式表示。
  • 采样间隔: 10秒

3. 同步波形数据 (sample_data/waveform)

  • 内容: 包含原始点波测量数据,采样频率为2.5kHz。
  • 波形长度: 约1秒
  • 采样间隔: 每10秒一个波形,采样间隔约为400微秒

4. 网络和参数数据

  • 内容: 包含时变电路拓扑和参数信息,如线路连接、变压器铭牌额定值和断路器状态。
  • 物理资产网络: 模型化电路至单个组件,电力传输元素(如线路、变压器、开关)为图的边,母线为节点。
  • 电气网络: 通过零阻抗和无限阻抗元素(如短线路、闭合/断开断路器)推导。

数据质量

  • 同步精度: 现场测试显示,同步误差方差为0.625度。
  • 传感器误差: 传感器误差通常小于0.5%,但在轻载电路中使用过大的电流互感器时误差较大。
  • 数据缺失: 由于网络和电源中断、系统维护等原因,数据中偶尔存在缺失。
  • 电路拓扑和参数: 实际中,配电系统操作员很少维护无错误的系统记录,部分信息为估计值。

快速开始与代码示例

  • 加载数据: 参见 data_IO.ipynb 中的示例代码。
  • 状态估计 (同步相量): 提供示例代码。
  • 电压控制: 使用线性分布式流模型 (LinDistFlow) 进行电压控制。
  • 状态估计 (同步波形): 提供示例代码,参见 code_examples/state_estimation_waveform.ipynb

引用

  • IEEE: 待补充
  • BibTex: 待补充

联系方式

免责声明

数据的准确性或可靠性不作任何保证,提供者不承担任何责任。

AI搜集汇总
数据集介绍
main_image_url
构建方式
该数据集由美国配电系统运营商合作伙伴提供,经过匿名化处理以移除所有地理标识符。数据涵盖了多种时间序列数据,包括电流和电压的均方根值、同步相量测量以及原始波形数据,采样频率从1秒到2.5kHz不等。此外,数据集还包含了电路拓扑和参数信息,如线路连接性、变压器铭牌额定值和断路器状态等。这些数据通过高精度的传感器和同步技术采集,确保了数据的实时性和准确性。
使用方法
用户可以通过下载样本数据集进行初步实验,样本数据与完整数据集的数据类型一致,但时间范围较小,便于快速验证代码。完整数据集预计于2025年2月开放访问,用户需提交申请。数据集的使用方法包括数据加载、状态估计和电压控制等,具体示例代码可在`data_IO.ipynb`中找到。用户还可以根据波形数据和电路参数进行时域电路功率流的仿真,相关实现细节在论文的V(b)和VI(b)部分有详细描述。
背景与挑战
背景概述
digital-twin-dataset数据集由美国合作伙伴配电系统运营商提供,数据经过匿名化处理以移除所有地理标识符。该数据集旨在为电力系统的数字孪生技术提供支持,涵盖了电流和电压的均方根值、同步相量测量以及原始波形数据等多种时间序列数据。此外,数据集还包含电路拓扑和参数信息,如线路连接性、变压器铭牌额定值和断路器状态等。该数据集的核心研究问题在于如何利用高精度的时间序列数据和电路拓扑信息,构建电力系统的精确数字模型,从而支持电力系统的实时监控、状态估计和电压控制等应用。该数据集由加州理工学院的研究团队主导开发,预计于2025年2月正式发布完整版本,目前提供样本数据集供研究人员初步探索。
当前挑战
digital-twin-dataset数据集在构建和应用过程中面临多重挑战。首先,数据的高精度要求与传感器误差之间的矛盾显著,尽管传感器误差通常控制在0.5%以内,但在轻载电路中使用的大型电流互感器可能导致更高的误差。其次,数据同步问题突出,现场测试显示同步误差方差为0.625度,这对相位角敏感的电力系统分析提出了更高要求。此外,数据中存在不可避免的缺失,如网络和电力中断、系统维护等导致的间隙,这要求研究人员开发鲁棒的数据处理方法。最后,电路拓扑和参数信息的准确性难以完全保证,尤其是线路绝缘材料、长度和变压器分接头位置等信息的估计可能引入不确定性,这对数字孪生模型的精确性提出了挑战。
常用场景
经典使用场景
在电力系统研究中,digital-twin-dataset数据集被广泛应用于电力网络的实时监控与状态估计。通过提供高精度的同步相量、波形数据以及电路拓扑信息,研究人员能够构建精确的电力系统数字孪生模型,从而实现对电网状态的实时分析与预测。
解决学术问题
该数据集解决了电力系统中数据稀缺与不精确的问题,特别是在分布式电网的实时监控与故障诊断领域。通过提供高分辨率的时间序列数据,研究人员能够更准确地模拟电网的动态行为,进而优化电网的运行效率与稳定性。
实际应用
在实际应用中,digital-twin-dataset数据集被用于智能电网的电压控制与功率流优化。电力公司利用该数据集中的同步相量数据,能够实时调整电网的运行参数,确保电力供应的稳定性与高效性,特别是在应对突发负载变化或故障时表现出色。
数据集最近研究
最新研究方向
在电力系统数字孪生领域,`digital-twin-dataset`数据集的最新研究方向聚焦于高精度同步测量数据的应用与优化。随着智能电网技术的快速发展,同步相量测量单元(PMU)和波形数据的精确性成为研究热点。该数据集提供的同步相量和波形数据,为电力系统状态估计、故障检测和电压控制等关键问题提供了丰富的研究素材。特别是在动态电路模型和时域功率流分析中,数据集的高粒度数据支持了复杂电力网络行为的精确模拟。此外,数据集中的电路拓扑和参数信息为电力系统的物理资产网络建模提供了重要参考,推动了电力系统数字孪生技术的实际应用与优化。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Breast Cancer Dataset

该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。

github 收录

中国交通事故深度调查(CIDAS)数据集

交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、

北方大数据交易中心 收录

FER2013

FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。

github 收录

中国250米灌溉耕地分布数据集(2000-2020)

灌溉耕地分布是开展生态、水文和气候研究的关键数据,并在水土资源管理中具有特别重要的地位。通过半自动机器学习模型,融合多源遥感数据(包括耕地分布、植被指数、水稻田分布)、灌溉统计和调查数据,以及灌溉适宜性分析,生成了中国逐年、250米灌溉耕地分布图(CIrrMap250)。利用2万个参考样本和高分辨率灌溉取水数据,对灌溉耕地分布数据的精度进行评估。结果显示,CIrrMap250在2000年、2010年和2020年的总体精度为0.79-0.88,优于现有的同类产品。

国家青藏高原科学数据中心 收录

中国食物成分数据库

食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。

国家人口健康科学数据中心 收录