American Housing Survey (AHS) national files|住房调查数据集|房地产市场数据集
收藏数据集概述
数据来源
- 数据集基于美国住房调查(AHS)的国家文件,自1985年以来的数据。
- 由美国住房和城市发展部公开,每两年更新一次,最新数据可用于2013年。
数据内容
- 住房层面变量:包括房间数量、建筑年份、占用状态(占用或空置)、租赁或拥有状态、单户或多户结构、建筑中的单位数量、当前市场价值和相对住房成本。
- 家庭层面变量:包括居住人数、家庭收入和居住地区类型(如城市或郊区)。
使用范围
- 本项目将使用2005年至2013年的数据,具体包括2005年、2007年、2009年、2011年和2013年的数据。
研究问题
1. 占用与未占用住房单位的市场价值差异及其随时间的变化趋势
- 描述性统计分析
- 比较两组(占用与未占用)的平均值
- 结论
2. 2008年次贷危机对住房租金的影响
- 合并2005至2013年的公平市场租金(FMR)数据
- 描述性统计分析
- 双样本假设检验
- 结论
3. 影响单户住宅市场价值的因素
- 回归模型中使用的变量及其使用理由
- 模型输出及变量间交互作用检查
- 解释模型中各变量对市场价值的影响
4. 预测同一物业的未来市场价值
- 使用2011年的自变量和2013年的因变量进行数据合并和清洗
- 模型评估,包括R平方和随机选择1000个住房单位的预测与实际比较,计算平均绝对偏差
数据分析方法
- 描述性统计分析
- 双样本假设检验
- 线性回归模型构建与解释
- 回归模型转换与解释
- 因变量预测
- 回归模型评估

Breast Ultrasound Images (BUSI)
小型(约500×500像素)超声图像,适用于良性和恶性病变的分类和分割任务。
github 收录
中国区域交通网络数据集
该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。
data.stats.gov.cn 收录
VoxBox
VoxBox是一个大规模语音语料库,由多样化的开源数据集构建而成,用于训练文本到语音(TTS)系统。
github 收录
AgiBot World
为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。
github 收录
DALY
DALY数据集包含了全球疾病负担研究(Global Burden of Disease Study)中的伤残调整生命年(Disability-Adjusted Life Years, DALYs)数据。该数据集提供了不同国家和地区在不同年份的DALYs指标,用于衡量因疾病、伤害和早逝导致的健康损失。
ghdx.healthdata.org 收录