PeMS data-sets|交通数据分析数据集|交通监控数据集
收藏PeMS-Datasets 数据集概述
数据来源与获取
- 数据集来自 Caltrans Performance Measurement System (PeMS) 的 Data Clearinghouse,网址为 http://pems.dot.ca.gov/。
- 访问数据集需要创建用户名和密码。
- 推荐使用批量下载器浏览器扩展下载数据集,因 Caltrans 限制使用程序化工具访问数据集。
数据加载
- 数据集最终存储于内部 SQL 服务器实例,具体配置见项目 Python 文件夹中的 main.py 文件。
- 下载后的数据集需放置于项目数据文件夹,并确保 PeMS SQL 对象(由 pemsObjects.sql 文件创建)存在于目标数据库中。
- 使用提供的 environment.yml 文件创建 Python 解释器,并运行 main.py 文件以加载数据集至 SQL 数据库。
数据集总结
- 数据库中的存储过程提供用户指定时间分辨率的 PeMS 数据集年度聚合,详细信息可参考 GitHub Wiki 页面。
匹配 PeMS 站点与 SANDAG 高速公路网络
- 项目中的 Python 微服务(位于 matching 文件夹)用于匹配 PeMS 站点元数据与 SANDAG 高速公路网络文件。
- 该脚本可独立运行,并使用单独的 environment.yml 文件。

MOOCs Dataset
该数据集包含了大规模开放在线课程(MOOCs)的相关数据,包括课程信息、用户行为、学习进度等。数据主要用于研究在线教育的行为模式和学习效果。
www.kaggle.com 收录
中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
Beijing Traffic
The Beijing Traffic Dataset collects traffic speeds at 5-minute granularity for 3126 roadway segments in Beijing between 2022/05/12 and 2022/07/25.
Papers with Code 收录
基于站点观测的中国1km土壤湿度日尺度数据集(2000-2022)
本研究提供了中国范围1km高质量的土壤湿度数据集-SMCI1.0(Soil Moisture of China by in situ data, version 1.0),SMCI1.0是包含2000-2022年、日尺度、以10厘米为间隔10层深度(10-100cm)的高时空分辨率土壤湿度,数据单位为0.001m³/m³,缺失值为-999,投影为WGS1984。该数据集是以中国气象局提供的1,648个站点观测10层土壤湿度作为基准,使用ERA5_Land气象强迫数据、叶面积指数(LAI)、土地覆盖类型(Landtypes)、地形(DEM)和土壤特性(Soil properties)作为协变量,通过机器学习方式获得。本研究进行了两组实验以验证SMCI1.0的精度,时间尺度上:ubRMSE为0.041-0.052,R为0.883-0.919;空间尺度上:ubRMSE为0.045-0.051,R为0.866-0.893。 由于SMCI1.0是基于实地观测的土壤湿度,它可以作为现有基于模型和卫星数据集的有效补充。该数据产品可用于各种水文、气象、生态分析和建模,尤其在需要高质量、高分辨率土壤湿度的应用上至关重要。有关数据集的引用及详细描述,请阅读说明文档。为便于使用,本研究提供了两种不同分辨率的版本:30 秒(~1km)和0.1度(~9km)。
国家青藏高原科学数据中心 收录
THUCNews
THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。
github 收录