The Cancer Genome Atlas (TCGA)|癌症研究数据集|基因组学数据集
收藏.png)
- 美国国家癌症研究所(NCI)和美国国家人类基因组研究所(NHGRI)联合启动The Cancer Genome Atlas (TCGA)项目,旨在通过大规模基因组分析揭示癌症的分子基础。
- TCGA项目发布首个癌症基因组图谱,涵盖了乳腺癌和脑肿瘤的基因组数据。
- TCGA项目扩展至包括肺癌、结肠癌和卵巢癌在内的多种癌症类型,并发布了相应的基因组数据。
- TCGA项目发布首个全面的癌症基因组图谱,涵盖了20种不同类型的癌症,标志着该项目进入全面数据公开阶段。
- TCGA项目发布关于胰腺癌的详细基因组分析结果,进一步丰富了癌症基因组数据库。
- TCGA项目正式结束数据收集,并发布了最终的综合报告,总结了所有参与癌症类型的基因组特征和分子机制。
- TCGA数据集被广泛应用于癌症研究和临床实践,成为全球癌症基因组研究的重要资源。
Wind Turbine Data
该数据集包含风力涡轮机的运行数据,包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态,适用于风能研究和风力发电系统的优化分析。
www.kaggle.com 收录
Subway Dataset
该数据集包含了全球多个城市的地铁系统数据,包括车站信息、线路图、列车时刻表、乘客流量等。数据集旨在帮助研究人员和开发者分析和模拟城市交通系统,优化地铁运营和乘客体验。
www.kaggle.com 收录
AISHELL/AISHELL-1
Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。
hugging_face 收录
典型分布式光伏出力预测数据集
光伏电站出力数据每5分钟从电站机房监控系统获取;气象实测数据从气象站获取,气象站建于电站30号箱变附近,每5分钟将采集的数据通过光纤传输到机房;数值天气预报数据利用中国电科院新能源气象应用机房的WRF业务系统(包括30TF计算刀片机、250TB并行存储)进行中尺度模式计算后输出预报产品,每日8点前通过反向隔离装置推送到电站内网预测系统。
国家基础学科公共科学数据中心 收录
RML24
RML24是首个专门为卫星信号识别和解调的深度学习应用设计的数据集。它整合了遥测和通信信号在遥测、跟踪和指挥(TT&C)系统中,并模拟了真实卫星信道中的信号损伤效应。该数据集利用软件定义无线电(SDR)平台和射频(RF)收发器进行严格的空中测量,并验证收集的数据。RML24为研究人员提供了基本的数据和建模基准,以促进智能和自适应卫星通信系统的算法验证和发展,推动数据驱动卫星通信技术的发展。
github 收录