United States Congressional Bills|立法数据集|法律文本数据集
收藏
- United States Congressional Bills数据集首次发布,包含了自1993年以来美国国会通过的法案文本。
- 数据集扩展至包含1993年至1998年间的所有法案文本,为研究者提供了更丰富的历史数据。
- 数据集进一步更新,涵盖了1993年至2004年的法案文本,并开始提供XML格式的数据,便于更深入的文本分析。
- 数据集的覆盖范围扩展至1993年至2010年,同时增加了对法案状态和历史记录的详细描述,提升了数据集的实用性和研究价值。
- 数据集再次更新,包含了1993年至2016年的法案文本,并引入了更多的元数据,如法案的提交者、委员会信息等,进一步丰富了数据集的内容。
- 1United States Congressional Bills ProjectUnited States Government Publishing Office · 2009年
- 2Analyzing Legislative Texts: A Case Study on United States Congressional BillsAssociation for Computational Linguistics · 2018年
- 3Predicting Legislative Outcomes Using Textual Analysis: A Case Study on United States Congressional BillsSAGE Publications · 2020年
- 4The Impact of Legislative Text on Public Policy: Evidence from United States Congressional BillsCambridge University Press · 2019年
- 5Textual Analysis of Legislative Intent: A Study of United States Congressional BillsTaylor & Francis Online · 2021年
中国交通事故深度调查(CIDAS)数据集
交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、
北方大数据交易中心 收录
MedChain
MedChain是由香港城市大学、香港中文大学、深圳大学、阳明交通大学和台北荣民总医院联合创建的临床决策数据集,包含12,163个临床案例,涵盖19个医学专科和156个子类别。数据集通过五个关键阶段模拟临床工作流程,强调个性化、互动性和顺序性。数据来源于中国医疗网站“iiYi”,经过专业医生验证和去识别化处理,确保数据质量和患者隐私。MedChain旨在评估大型语言模型在真实临床场景中的诊断能力,解决现有基准在个性化医疗、互动咨询和顺序决策方面的不足。
arXiv 收录
Plant-Diseases
Dataset for Plant Diseases containg variours Plant Disease
kaggle 收录
LibriSpeech
LibriSpeech 是一个大约 1000 小时的 16kHz 英语朗读语音语料库,由 Vassil Panayotov 在 Daniel Povey 的协助下编写。数据来自 LibriVox 项目的已读有声读物,并经过仔细分割和对齐。
OpenDataLab 收录
安星云平台
安星平台是一个功能强大的工具,用于管理消防技术服务公司或个人的日常工作流程,提高工作效率。该平台支持多种任务类型,包括消防维保、消防检测和消防评估等,能够满足不同用户的需求。在安星平台上,用户可以快速创建任务、分配任务、跟踪任务进展并生成报告,从而使得整个工作流程更加高效和透明。此外,安星还集成了多种智能功能,如自动提醒、智能报表和数据分析等,帮助用户更好地掌握工作进展和趋势,从而做出更明智的决策。
苏州大数据交易所 收录