Titanic Dataset|生存预测数据集|乘客特征分析数据集
收藏Titanic Dataset 概述
数据集组成
- 训练集 (train.csv):用于构建机器学习模型,包含每个乘客的生存结果(“ground truth”)。
- 测试集 (test.csv):用于评估模型在未见数据上的表现,不包含每个乘客的生存结果,需预测。
- 性别提交示例 (gender_submission.csv):假设所有和仅女性乘客生存的预测示例。
数据字典
变量 | 定义 | 说明 |
---|---|---|
survival | 生存情况 | 0 = 否, 1 = 是 |
pclass | 票等级 | 1 = 头等, 2 = 二等, 3 = 三等 |
sex | 性别 | |
Age | 年龄 | 若小于1则为小数,估计年龄为xx.5 |
sibsp | 兄弟姐妹/配偶数量 | 兄弟姐妹包括兄弟、姐妹、继兄弟、继姐妹;配偶包括丈夫、妻子 |
parch | 父母/子女数量 | 父母包括母亲、父亲;子女包括女儿、儿子、继女、继子;部分儿童仅与保姆同行 |
ticket | 票号 | |
fare | 乘客票价 | |
cabin | 客舱号 | |
embarked | 登船港口 | C = Cherbourg, Q = Queenstown, S = Southampton |
变量注释
- pclass:社会经济地位的代理,1st = 上层,2nd = 中层,3rd = 下层。
- Age:年龄若小于1则为小数,估计年龄格式为xx.5。
- sibsp:兄弟姐妹包括兄弟、姐妹、继兄弟、继姐妹;配偶包括丈夫、妻子。
- parch:父母包括母亲、父亲;子女包括女儿、儿子、继女、继子;部分儿童仅与保姆同行。

Beijing Traffic
The Beijing Traffic Dataset collects traffic speeds at 5-minute granularity for 3126 roadway segments in Beijing between 2022/05/12 and 2022/07/25.
Papers with Code 收录
ROBEL
ROBEL是一个开源的低成本机器人平台,专为现实世界的强化学习设计。该平台由谷歌研究院和加州大学伯克利分校共同开发,包含两个机器人:D'Claw,一个三指手机器人,用于促进精细操作任务的学习;D'Kitty,一个四足机器人,用于促进敏捷的腿式移动任务学习。这些模块化机器人易于维护且足够坚固,能够承受从零开始的硬件强化学习,目前已记录超过14000小时的训练时间。ROBEL提供了一系列连续控制基准任务,这些任务具有密集和稀疏的任务目标,并引入了硬件安全评分指标。数据集和相关材料可在www.roboticsbenchmarks.org访问,旨在解决强化学习在真实机器人上的应用问题,特别是在处理物理限制和环境交互方面的挑战。
arXiv 收录
Materials Project
材料项目是一组标有不同属性的化合物。数据集链接: MP 2018.6.1(69,239 个材料) MP 2019.4.1(133,420 个材料)
OpenDataLab 收录
Solar Radiation Data
该数据集包含全球多个地点的太阳辐射数据,涵盖了不同时间段和气象条件下的辐射强度。数据包括直接辐射、散射辐射和总辐射等指标,适用于太阳能资源评估和气候研究。
www.nrel.gov 收录
OpenSonarDatasets
OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。
github 收录