five

clinical trials information|临床试验数据集|医学研究数据集

收藏
github2024-02-23 更新2024-05-31 收录
临床试验
医学研究
下载链接:
https://github.com/datasets/clinical-trials-us
下载链接
链接失效反馈
资源简介:
来自ClinicalTrials.gov的官方美国临床试验结果数据,包含公开和私人支持的全球人类参与者临床研究。

Official U.S. clinical trial results data from ClinicalTrials.gov, encompassing both publicly and privately supported clinical studies involving human participants worldwide.
创建时间:
2013-02-07
AI搜集汇总
数据集介绍
main_image_url
构建方式
该数据集基于ClinicalTrials.gov平台,该平台是一个全球范围内公开和私人支持的人类参与者临床试验的注册和结果数据库。自2007年9月起,根据FDAAA 801法规,所有适用的临床试验必须在该数据库中注册。数据集通过从该平台下载所有搜索结果构建,下载的文件为XML格式,包含大量临床试验的详细信息。
特点
数据集包含139,848个XML文件,截至2013年2月2日的数据统计,其中仅有8,044个试验包含发布的结果。每个XML文件详细记录了临床试验的各个方面,包括试验设计、参与者信息、干预措施和结果等。数据集的XML结构遵循特定的XSD模式,确保了数据的标准化和一致性。
使用方法
使用该数据集时,用户首先需访问ClinicalTrials.gov网站,通过无查询搜索获取所有结果,并下载包含所有数据的ZIP文件。解压后,用户将获得2.3GB的XML文件。为进一步处理数据,可使用提供的Node.js脚本extract.js,该脚本仍在开发中,但已能帮助用户提取和分析XML文件中的关键信息。
背景与挑战
背景概述
临床实验信息数据集源自ClinicalTrials.gov,这是一个全球范围内公开和私人支持的人类参与者临床研究的注册和结果数据库。自2007年9月起,根据FDAAA 801法案,所有适用的临床试验都必须在该数据库中注册。该数据集由大量XML文件组成,截至2013年2月2日,共包含139,848个文件,其中仅有8,044个试验包含了发布的结果。这一数据集的创建旨在为研究人员、医疗专业人员和政策制定者提供全面、透明的临床试验信息,从而促进医学研究的透明度和可访问性。
当前挑战
临床实验信息数据集在解决临床试验透明度和可访问性问题方面面临多重挑战。首先,尽管数据集规模庞大,但仅有少数试验包含了发布的结果,这限制了数据的完整性和实用性。其次,数据的XML格式虽然结构化,但其复杂性增加了数据解析和处理的难度,尤其是在需要自动化处理和分析时。此外,数据集的更新频率和实时性也是一个重要问题,因为临床试验的进展和结果发布需要及时反映在数据库中。最后,数据集的构建和维护需要跨学科合作,包括医学、信息技术和法律等多个领域的专业知识,这对数据集的持续发展和优化提出了更高的要求。
常用场景
经典使用场景
在医学研究领域,clinical trials information数据集被广泛用于分析全球范围内的临床试验数据。研究者通过该数据集可以获取关于药物疗效、治疗方案比较以及患者安全性的关键信息。这些数据对于验证新药的有效性和安全性至关重要,同时也为医学研究提供了丰富的实证基础。
衍生相关工作
基于clinical trials information数据集,许多经典的研究工作得以展开。例如,研究者开发了新的数据分析工具和算法,用于更高效地处理和分析大规模的临床试验数据。此外,该数据集还催生了一系列关于临床试验透明度和数据共享的学术讨论,推动了医学研究领域的开放科学运动。
数据集最近研究
最新研究方向
在医学研究领域,clinical trials information数据集为全球范围内的临床试验提供了详尽的注册与结果数据。近年来,随着精准医疗和个性化治疗理念的兴起,该数据集在药物研发、治疗方案优化及患者分层研究中的应用日益广泛。研究者们通过分析这些数据,能够更深入地理解不同治疗方案的效果与安全性,进而推动新药的快速审批与上市。此外,随着人工智能与大数据技术的融合,该数据集在预测模型构建、临床试验设计优化及患者招募策略改进等方面展现出巨大潜力。特别是在COVID-19疫情期间,该数据集为疫苗与治疗药物的快速研发提供了重要支持,进一步凸显了其在公共卫生事件中的关键作用。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

Beijing Traffic

The Beijing Traffic Dataset collects traffic speeds at 5-minute granularity for 3126 roadway segments in Beijing between 2022/05/12 and 2022/07/25.

Papers with Code 收录

中国逐日降水数据集(1961-2022,0.1°/0.25°/0.5°)

CHM_PRE数据集基于中国境内及周边1961至今共2839个站点的日降水观测,在传统的“降水背景场 + 降水比值场”的数据集构建思路上,尝试应用月值降水约束和地形特征校正,并依据中国范围内约4万个高密度站点2015–2019年的日降水量插值后数据进行精度评价。经评估认为,CHM_PRE可以较好的表征降水的空间变异性,其日值时间序列与高密度站点日值降水观测结果之间的相关系数中位数为0.78,均方根误差中位数为8.8 mm/d,KGE值中位数为0.69,与目前常用的降水数据集(CGDPA、CN05.1、CMA V2.0)有很好的一致性。 数据集的时间范围为1961年至今,空间分辨率为0.1°、0.25°和0.5°,经纬度范围为18°N–54°N, 72°E–136°E。

国家青藏高原科学数据中心 收录

MedDialog

MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。

github 收录

中国1km分辨率年平均气温数据(1901-2023年)

中国1km分辨率年平均气温数据(1901-2023年)根据西北农林科技大学彭守璋研究员团队研制的1901-2023年中国1km分辨率逐月平均气温数据集进行年度均值合成后除以10将单位换算为℃得到。数据包含多个TIF文件,每个TIF文件为对应年份的年平均气温,平均气温单位为℃。彭守璋研究员在《Earth System Science Data》以论文形式发布了1 km monthly temperature and precipitation dataset for China from 1901 to 2017数据。论文链接https://doi.org/10.5194/essd-11-1931-2019。

国家地球系统科学数据中心 收录

糖尿病预测数据集

糖尿病相关的医学研究或者健康数据

AI_Studio 收录