five

American Housing Survey (AHS) national files|住房调查数据集|房地产市场数据集

收藏
github2022-12-27 更新2024-05-31 收录
住房调查
房地产市场
下载链接:
https://github.com/xiaojie-qian/House-and-Urban-development
下载链接
链接失效反馈
资源简介:
数据集基于美国住房调查(AHS)的国家文件,自1985年以来的数据。住房级变量包括住房单位中的房间数量、建筑年份、是否被占用或空置、是否出租或拥有、是否为单个单位或多单位结构、建筑中的单位数量、当前市场价值以及相对住房成本的度量。数据集还包括描述家庭中居住人数、家庭收入和居住区域类型的变量,例如城市或郊区。这些数据由美国住房和城市发展部每两年向公众提供一次,最新数据可用于2013年。

The dataset is based on the national files of the American Housing Survey (AHS), containing data since 1985. Housing-level variables include the number of rooms in the housing unit, the year of construction, whether it is occupied or vacant, whether it is rented or owned, whether it is a single-unit or multi-unit structure, the number of units in the building, the current market value, and measures of relative housing cost. The dataset also includes variables describing the number of people living in the household, household income, and the type of residential area, such as urban or suburban. These data are provided to the public every two years by the U.S. Department of Housing and Urban Development, with the latest data available for 2013.
创建时间:
2022-12-20
原始信息汇总

数据集概述

数据来源

  • 数据集基于美国住房调查(AHS)的国家文件,自1985年以来的数据。
  • 由美国住房和城市发展部公开,每两年更新一次,最新数据可用于2013年。

数据内容

  • 住房层面变量:包括房间数量、建筑年份、占用状态(占用或空置)、租赁或拥有状态、单户或多户结构、建筑中的单位数量、当前市场价值和相对住房成本。
  • 家庭层面变量:包括居住人数、家庭收入和居住地区类型(如城市或郊区)。

使用范围

  • 本项目将使用2005年至2013年的数据,具体包括2005年、2007年、2009年、2011年和2013年的数据。

研究问题

1. 占用与未占用住房单位的市场价值差异及其随时间的变化趋势

  • 描述性统计分析
  • 比较两组(占用与未占用)的平均值
  • 结论

2. 2008年次贷危机对住房租金的影响

  • 合并2005至2013年的公平市场租金(FMR)数据
  • 描述性统计分析
  • 双样本假设检验
  • 结论

3. 影响单户住宅市场价值的因素

  • 回归模型中使用的变量及其使用理由
  • 模型输出及变量间交互作用检查
  • 解释模型中各变量对市场价值的影响

4. 预测同一物业的未来市场价值

  • 使用2011年的自变量和2013年的因变量进行数据合并和清洗
  • 模型评估,包括R平方和随机选择1000个住房单位的预测与实际比较,计算平均绝对偏差

数据分析方法

  • 描述性统计分析
  • 双样本假设检验
  • 线性回归模型构建与解释
  • 回归模型转换与解释
  • 因变量预测
  • 回归模型评估
AI搜集汇总
数据集介绍
main_image_url
构建方式
American Housing Survey (AHS) national files数据集基于自1985年以来的美国住房调查数据构建,涵盖了住房层面的多项变量,如房间数量、建筑年份、住房占用状态、租赁或所有权情况、建筑类型、建筑内单元数量、当前市场价值以及相对住房成本等。此外,数据集还包含了描述家庭人口数量、家庭收入及居住区域类型(如城市或郊区)的变量。这些数据由美国住房和城市发展部每两年发布一次,最新数据截至2013年。在本项目中,主要使用了2005年至2013年的数据,包括2005年、2007年、2009年、2011年和2013年的数据。
使用方法
该数据集的使用方法多样,适用于多种分析场景。首先,可以通过描述性统计方法分析住房市场的基本特征,如住房占用状态与市场价值的关系。其次,可以利用假设检验方法探讨特定事件(如2008年次贷危机)对住房租金的影响。此外,回归模型可用于识别影响单户住房市场价值的关键因素,并基于历史数据预测未来市场价值。最后,通过模型评估方法(如R平方和平均绝对偏差)验证预测模型的准确性,确保分析结果的可靠性。
背景与挑战
背景概述
美国住房调查(American Housing Survey, AHS)全国数据集自1985年起由美国住房与城市发展部(US Department of Housing and Urban Development)发布,旨在提供关于美国住房市场的详细统计信息。该数据集涵盖了住房单元的多个关键变量,包括房间数量、建筑年份、居住状态、租赁或所有权情况、建筑类型、市场价值以及相对住房成本等。此外,数据集还包含家庭人口数量、家庭收入以及居住区域类型等信息。AHS数据集每两年更新一次,最新数据截至2013年。该数据集为研究住房市场动态、政策影响以及社会经济因素对住房价值的影响提供了重要支持,广泛应用于城市规划、经济学研究以及政策制定等领域。
当前挑战
AHS数据集在应用过程中面临多重挑战。首先,住房市场的复杂性和多样性使得数据分析和建模难度增加,尤其是如何准确捕捉住房价值的影响因素。其次,数据的时间跨度较长,不同年份之间的数据结构和变量定义可能存在差异,增加了数据清洗和整合的复杂性。此外,2008年次贷危机对住房市场的影响需要特别关注,如何从数据中分离出危机的影响并分析其长期效应是一个重要挑战。最后,预测未来住房市场价值时,模型的准确性和稳定性受到数据质量、变量选择以及模型假设的限制,如何构建可靠的预测模型仍需进一步探索。
常用场景
经典使用场景
American Housing Survey (AHS) national files 数据集广泛应用于住房市场分析领域,特别是在研究住房单位的市场价值、租金变化以及住房结构特征等方面。研究者通常利用该数据集进行时间序列分析,探讨住房市场在不同经济周期中的表现,如2008年次贷危机对住房租金的影响。此外,该数据集还常用于比较不同居住状态(如占用与空置)住房的市场价值差异,揭示其潜在的经济规律。
解决学术问题
AHS数据集为学术界提供了丰富的住房市场数据,解决了多个关键研究问题。例如,通过分析2005年至2013年的数据,研究者能够揭示住房市场价值的长期趋势及其影响因素。此外,该数据集还帮助学者评估经济事件(如次贷危机)对住房市场的冲击,并通过回归模型预测未来市场价值。这些研究不仅深化了对住房市场的理解,还为政策制定者提供了数据支持。
实际应用
在实际应用中,AHS数据集被广泛用于政府机构和非营利组织的政策评估与规划。例如,美国住房与城市发展部利用该数据集监测住房市场的健康状况,评估住房政策的实施效果。房地产开发商和经济分析师则通过分析该数据集,预测未来市场需求,优化投资决策。此外,该数据集还为城市规划者提供了重要参考,帮助其制定更合理的土地利用和住房供应策略。
数据集最近研究
最新研究方向
近年来,American Housing Survey (AHS) 数据集在住房市场研究领域引起了广泛关注,尤其是在2008年次贷危机后,研究者们更加关注住房市场的变化及其影响因素。通过对2005年至2013年的数据进行分析,研究者们探讨了住房市场价值的变化趋势,特别是空置与占用住房之间的市场价值差异及其随时间的变化模式。此外,次贷危机对租金的影响也成为研究热点,通过描述性统计和假设检验,研究者们试图揭示危机对住房租金的长期影响。在预测住房市场价值方面,研究者们利用回归模型分析了单户住宅的市场价值影响因素,并通过数据清理和模型评估,预测了未来市场价值的变化趋势。这些研究不仅为政策制定者提供了重要参考,也为房地产市场参与者提供了决策依据。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Breast Ultrasound Images (BUSI)

小型(约500×500像素)超声图像,适用于良性和恶性病变的分类和分割任务。

github 收录

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

VoxBox

VoxBox是一个大规模语音语料库,由多样化的开源数据集构建而成,用于训练文本到语音(TTS)系统。

github 收录

AgiBot World

为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。

github 收录

DALY

DALY数据集包含了全球疾病负担研究(Global Burden of Disease Study)中的伤残调整生命年(Disability-Adjusted Life Years, DALYs)数据。该数据集提供了不同国家和地区在不同年份的DALYs指标,用于衡量因疾病、伤害和早逝导致的健康损失。

ghdx.healthdata.org 收录