five

Psychiatric Genomics Consortium (PGC)|精神疾病数据集|遗传学数据集

收藏
www.med.unc.edu2024-10-31 收录
精神疾病
遗传学
下载链接:
https://www.med.unc.edu/pgc/results-and-downloads
下载链接
链接失效反馈
资源简介:
Psychiatric Genomics Consortium (PGC) 数据集包含了大量关于精神疾病遗传学的研究数据,包括基因组关联研究(GWAS)的结果、基因表达数据、以及与精神疾病相关的遗传变异信息。该数据集旨在促进对精神疾病遗传基础的理解和研究。
提供机构:
www.med.unc.edu
AI搜集汇总
数据集介绍
main_image_url
构建方式
Psychiatric Genomics Consortium (PGC) 数据集的构建基于大规模的基因组关联研究(GWAS),汇集了来自全球多个研究中心的遗传数据。该数据集通过收集和整合精神疾病患者的基因信息,以及健康对照组的基因数据,采用高通量测序技术进行基因型和表型数据的分析。研究团队严格遵循国际标准的数据处理流程,确保数据的质量和一致性,从而为精神疾病的遗传学研究提供了坚实的基础。
特点
PGC 数据集的显著特点在于其规模庞大且多样性丰富,涵盖了多种精神疾病,如抑郁症、精神分裂症和双相情感障碍等。数据集不仅包括了大量的病例和对照样本,还提供了详细的基因型和表型信息,为研究者提供了深入分析的素材。此外,该数据集的开放性和共享性也是其重要特点,促进了全球范围内的合作研究,加速了精神疾病遗传机制的发现和理解。
使用方法
PGC 数据集的使用方法多样,适用于多种研究目的。研究者可以通过访问PGC的官方网站或相关数据库,下载所需的数据集进行分析。常见的使用方法包括基因关联分析、全基因组关联研究(GWAS)、以及多基因风险评分(PRS)等。此外,数据集还可用于机器学习和人工智能模型的训练,以预测精神疾病的风险和诊断。研究者在利用该数据集时,需遵循相关的数据使用协议和伦理规范,确保研究的科学性和合法性。
背景与挑战
背景概述
精神病基因组学联盟(Psychiatric Genomics Consortium, PGC)成立于2007年,由全球多个顶尖研究机构和科学家共同发起,旨在通过大规模基因组研究揭示精神疾病的发病机制。PGC的核心研究问题包括识别与精神疾病相关的基因变异、探索基因与环境的交互作用,以及开发基于基因组信息的精神疾病风险预测模型。该联盟的成果对精神病学、遗传学和公共卫生领域产生了深远影响,推动了个性化医疗的发展,并为全球精神健康政策的制定提供了科学依据。
当前挑战
PGC在构建过程中面临诸多挑战。首先,精神疾病的遗传异质性极高,导致基因关联研究的复杂性增加。其次,样本收集和数据标准化是另一大难题,涉及多中心、跨国界的合作,数据质量和一致性难以保证。此外,基因与环境因素的交互作用分析需要跨学科的方法和工具,增加了研究的难度。最后,数据隐私和伦理问题也是PGC必须面对的重要挑战,如何在保护个体隐私的同时,充分利用大数据进行科学研究,是一个亟待解决的问题。
发展历史
创建时间与更新
Psychiatric Genomics Consortium (PGC) 数据集创建于2007年,旨在通过大规模的基因组研究来揭示精神疾病的遗传基础。该数据集自创建以来,持续进行更新和扩展,以纳入最新的基因组数据和研究成果。
重要里程碑
PGC数据集的重要里程碑包括2013年发布的关于精神分裂症的基因组关联研究,该研究首次揭示了多个与精神分裂症相关的基因位点,极大地推动了精神疾病遗传学的研究进展。随后,2018年,PGC发布了关于双相情感障碍和抑郁症的大规模基因组研究结果,进一步丰富了精神疾病遗传学的知识库。这些里程碑事件不仅提升了PGC数据集的学术影响力,也为后续的研究提供了宝贵的资源。
当前发展情况
当前,PGC数据集已成为精神疾病遗传学研究的核心资源,其数据被广泛应用于基因关联分析、功能基因组学研究以及药物靶点发现等多个领域。PGC的持续更新和扩展,确保了数据集的时效性和全面性,为全球研究者提供了高质量的基因组数据支持。此外,PGC还积极推动国际合作,通过共享数据和资源,加速了精神疾病遗传学领域的知识积累和技术进步,对相关领域的科学研究和临床应用产生了深远的影响。
发展历程
  • Psychiatric Genomics Consortium (PGC) 首次成立,旨在通过大规模合作研究,推动精神病学基因组学的发展。
    2007年
  • PGC 发布了首个关于精神分裂症的全基因组关联研究(GWAS)结果,标志着该领域的重要突破。
    2009年
  • PGC 扩展了其研究范围,开始进行双相情感障碍的全基因组关联研究,进一步丰富了其数据集。
    2011年
  • PGC 发布了关于重度抑郁症的全基因组关联研究结果,为理解抑郁症的遗传基础提供了重要数据。
    2013年
  • PGC 启动了跨疾病分析项目,旨在通过比较不同精神疾病的遗传数据,揭示共有的遗传风险因素。
    2015年
  • PGC 发布了关于焦虑症的全基因组关联研究结果,进一步扩展了其在精神病学领域的研究覆盖面。
    2018年
  • PGC 开始整合多组学数据,包括基因组学、表观基因组学和转录组学,以更全面地理解精神疾病的复杂性。
    2020年
常用场景
经典使用场景
在精神病学领域,Psychiatric Genomics Consortium (PGC) 数据集被广泛用于大规模基因关联研究。该数据集整合了来自全球多个研究中心的精神疾病患者和对照组的基因数据,为研究人员提供了丰富的遗传信息资源。通过分析这些数据,研究者能够识别与精神疾病相关的基因变异,从而深入理解疾病的遗传基础。
衍生相关工作
基于 PGC 数据集的研究成果,衍生出了多项重要的相关工作。例如,研究人员利用该数据集开发了多种精神疾病的风险预测模型,这些模型在临床实践中得到了广泛应用。此外,PGC 数据集还促进了跨学科合作,推动了精神病学与神经科学、遗传学等领域的交叉研究,为精神疾病的综合治疗提供了新的思路和方法。
数据集最近研究
最新研究方向
在精神病学领域,Psychiatric Genomics Consortium (PGC) 数据集的最新研究方向主要集中在多基因风险评分(PRS)的应用与优化。通过整合大规模的基因组数据,研究人员致力于开发更为精确的PRS模型,以预测个体患精神疾病的风险。这一方向不仅有助于早期诊断和干预,还为个性化医疗提供了新的可能性。此外,PGC数据集还被用于探索基因与环境因素的交互作用,揭示精神疾病复杂病因的深层机制。这些研究成果对于推动精神病学领域的科学进步和临床实践具有重要意义。
相关研究论文
  • 1
    Psychiatric Genomics Consortium: an open resource for the psychiatric genetics communityPsychiatric Genomics Consortium · 2014年
  • 2
    Genome-wide association study identifies 30 loci associated with bipolar disorderPsychiatric Genomics Consortium · 2019年
  • 3
    Genome-wide association study of more than 40,000 bipolar disorder cases provides new insights into the underlying biologyPsychiatric Genomics Consortium · 2021年
  • 4
    Genome-wide association study identifies 13 new risk loci for schizophreniaPsychiatric Genomics Consortium · 2014年
  • 5
    Genome-wide association study identifies 15 new risk loci for schizophreniaPsychiatric Genomics Consortium · 2019年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LibriSpeech

LibriSpeech 是一个大约 1000 小时的 16kHz 英语朗读语音语料库,由 Vassil Panayotov 在 Daniel Povey 的协助下编写。数据来自 LibriVox 项目的已读有声读物,并经过仔细分割和对齐。

OpenDataLab 收录

The Sol Genomics Network (SGN)

The Sol Genomics Network (SGN) 是一个专注于茄科植物基因组学研究的在线数据库和资源平台。该数据集包含了大量关于番茄、马铃薯、辣椒等茄科植物的基因组、遗传图谱、分子标记、QTL(数量性状位点)分析、表达数据以及相关文献等信息。SGN 旨在促进茄科植物的遗传学和基因组学研究,支持全球科研人员进行数据共享和合作。

solgenomics.net 收录

Breast Cancer Dataset

该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。

github 收录

Figshare

Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。

figshare.com 收录

CliMedBench

CliMedBench是一个大规模的中文医疗大语言模型评估基准,由华东师范大学等机构创建。该数据集包含33,735个问题,涵盖14个核心临床场景,主要来源于顶级三级医院的真实电子健康记录和考试练习。数据集的创建过程包括专家指导的数据选择和多轮质量控制,确保数据的真实性和可靠性。CliMedBench旨在评估和提升医疗大语言模型在临床决策支持、诊断和治疗建议等方面的能力,解决医疗领域中模型性能评估的不足问题。

arXiv 收录