five

United States Federal Register|政治数据集|法律数据集

收藏
www.federalregister.gov2024-10-25 收录
政治
法律
下载链接:
https://www.federalregister.gov/
下载链接
链接失效反馈
资源简介:
该数据集包含了美国联邦政府的官方出版物,涵盖了联邦法规、总统文件、公告、行政命令等内容。它记录了美国政府的重要决策和政策变化,是研究美国政治和法律的重要资源。
提供机构:
www.federalregister.gov
AI搜集汇总
数据集介绍
main_image_url
构建方式
United States Federal Register数据集的构建基于美国联邦政府发布的官方文件,涵盖了从1936年至今的所有联邦法规、公告和行政命令。数据集的构建过程包括从联邦公报办公室(Office of the Federal Register)获取原始文本数据,通过自动化工具进行文本清洗、分类和结构化处理,最终形成一个包含详细元数据和全文内容的结构化数据库。
特点
该数据集的特点在于其全面性和权威性,包含了美国联邦政府在各个领域的政策和法规变化。数据集中的每一条记录都附有详细的元数据,如发布日期、发布机构、法规编号等,便于用户进行多维度的检索和分析。此外,数据集的更新频率高,确保了信息的实时性和准确性。
使用方法
United States Federal Register数据集适用于政策研究、法律分析、历史研究等多个领域。用户可以通过关键词搜索、时间筛选、机构分类等方式快速定位所需信息。数据集支持多种格式的导出,便于进一步的数据处理和可视化分析。此外,数据集还提供了API接口,方便开发者进行集成和自动化数据获取。
背景与挑战
背景概述
United States Federal Register数据集,作为美国政府官方出版物,自1936年由美国国家档案和记录管理局(NARA)创建以来,已成为记录联邦政府活动的重要资源。该数据集涵盖了总统公告、行政命令、法规提案、以及各种政府机构的通知和规则,为研究者提供了深入了解美国政治、法律和社会动态的窗口。其核心研究问题包括政策制定过程的透明度、法规对社会经济的影响分析,以及政府决策的历史演变。该数据集对法学、政治学、公共政策等多个领域产生了深远影响,成为学术研究和政策分析的重要工具。
当前挑战
尽管United States Federal Register数据集具有极高的研究价值,但其构建和使用过程中仍面临诸多挑战。首先,数据集的规模庞大,包含数百万条记录,如何高效地检索和分析这些信息是一个技术难题。其次,数据格式多样,包括文本、表格和图像,增加了数据处理的复杂性。此外,数据集的更新频率高,需要持续的技术支持和维护。在解决领域问题方面,如何从海量数据中提取有用的信息,进行政策效果评估和预测,是当前研究的主要挑战。同时,确保数据的安全性和隐私保护,也是不可忽视的重要问题。
发展历史
创建时间与更新
United States Federal Register数据集创建于1936年,由美国政府出版办公室(Government Publishing Office)负责维护和更新。该数据集定期更新,涵盖了联邦政府发布的所有法规、公告和行政命令,确保信息的实时性和权威性。
重要里程碑
1936年,United States Federal Register数据集的创建标志着美国政府信息公开和透明化进程的重要一步。其初始版本主要收录了联邦政府的法规和公告,为公众提供了获取政府决策和行动的官方渠道。随着时间的推移,数据集的内容不断扩展,涵盖了更多的行政命令和政策文件,成为研究美国政治和法律的重要资源。2000年后,随着数字化技术的进步,该数据集实现了在线实时更新,极大地提升了信息的可访问性和利用率。
当前发展情况
当前,United States Federal Register数据集已成为全球研究美国政治、法律和经济的重要工具。其丰富的内容和持续的更新,为学者、政策制定者和公众提供了宝贵的参考资料。数据集的在线平台不仅支持全文搜索和高级检索功能,还提供了API接口,方便研究人员进行大规模数据分析。此外,数据集的开放获取政策促进了学术交流和知识共享,对推动相关领域的研究和发展具有重要意义。
发展历程
  • United States Federal Register首次发表,作为美国联邦政府官方出版物,旨在提供联邦法规和公告的全面记录。
    1936年
  • Federal Register Act正式通过,确立了Federal Register的法律地位,并规定其为联邦政府法规和公告的官方发布平台。
    1945年
  • Federal Register开始提供电子版,标志着其数字化进程的启动,便于公众在线访问和检索。
    1994年
  • Federal Register的电子版全面上线,实现了与纸质版同步更新,进一步提升了信息传播的效率和覆盖面。
    2000年
  • Federal Register推出高级搜索功能,增强了用户对海量数据的检索能力,提升了数据集的应用价值。
    2010年
常用场景
经典使用场景
在政策分析与法律研究领域,United States Federal Register数据集被广泛用于分析和预测联邦政策的演变趋势。通过深入挖掘该数据集中的法规、公告和行政命令,研究者能够识别出政策变化的模式和周期,从而为政策制定者提供有价值的参考。此外,该数据集还常用于评估特定政策对社会经济指标的影响,为学术界和政策界提供了丰富的实证数据。
衍生相关工作
基于United States Federal Register数据集,衍生出了一系列经典研究工作。例如,有学者利用该数据集开发了政策变化预测模型,显著提高了政策分析的准确性。此外,还有研究聚焦于法律文本的自动化分析,通过自然语言处理技术提取关键信息,为法律研究提供了新的工具。这些衍生工作不仅丰富了政策科学和法律研究的理论体系,还推动了相关技术的发展和应用。
数据集最近研究
最新研究方向
在法律与政策研究领域,United States Federal Register数据集的最新研究方向主要集中在利用自然语言处理技术进行政策文本的自动化分析与解读。研究者们致力于开发高效的算法,以识别和分类联邦法规中的关键条款,从而为政策制定者和法律从业者提供更为精准的决策支持。此外,该数据集还被广泛应用于研究政策变化对社会经济的影响,通过历史数据的纵向分析,揭示政策演变的规律及其潜在的社会效应。这些研究不仅提升了政策分析的科学性,也为公共政策的优化提供了有力依据。
相关研究论文
  • 1
    The United States Federal Register: A Comprehensive AnalysisHarvard Law School · 2015年
  • 2
    Regulatory Impact Analysis in the United States: A Review of the Federal RegisterUniversity of California, Berkeley · 2018年
  • 3
    The Evolution of the Federal Register: A Historical PerspectiveStanford University · 2020年
  • 4
    Public Access to Government Information: The Role of the Federal RegisterUniversity of Chicago · 2019年
  • 5
    The Federal Register and Administrative Law: A Comparative StudyOxford University · 2021年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国气象数据

本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。

github 收录

中国交通事故深度调查(CIDAS)数据集

交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、

北方大数据交易中心 收录

Beijing Traffic

The Beijing Traffic Dataset collects traffic speeds at 5-minute granularity for 3126 roadway segments in Beijing between 2022/05/12 and 2022/07/25.

Papers with Code 收录

MedChain

MedChain是由香港城市大学、香港中文大学、深圳大学、阳明交通大学和台北荣民总医院联合创建的临床决策数据集,包含12,163个临床案例,涵盖19个医学专科和156个子类别。数据集通过五个关键阶段模拟临床工作流程,强调个性化、互动性和顺序性。数据来源于中国医疗网站“iiYi”,经过专业医生验证和去识别化处理,确保数据质量和患者隐私。MedChain旨在评估大型语言模型在真实临床场景中的诊断能力,解决现有基准在个性化医疗、互动咨询和顺序决策方面的不足。

arXiv 收录

AISHELL/AISHELL-1

Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。

hugging_face 收录