Pan-Cancer Atlas|癌症研究数据集|基因组学数据集
收藏
- Pan-Cancer Atlas项目正式启动,旨在通过整合多种癌症类型的数据,提供全面的癌症基因组学分析。
- Pan-Cancer Atlas的首批研究成果在《Cell》杂志上发表,揭示了多种癌症类型的共同基因组特征和差异。
- Pan-Cancer Atlas的全面分析报告在《Cell》系列期刊上发表,涵盖了27种癌症类型的基因组、转录组和表观基因组数据。
- Pan-Cancer Atlas的数据和分析工具被广泛应用于癌症研究和临床实践中,推动了个性化医疗的发展。
- Pan-Cancer Atlas的数据集被整合到多个国际癌症研究数据库中,促进了全球范围内的癌症研究合作。
- 1Comprehensive Characterization of Cancer Driver Genes and MutationsThe Cancer Genome Atlas Research Network · 2018年
- 2Pan-Cancer Analysis of Whole GenomesInternational Cancer Genome Consortium · 2020年
- 3Pan-Cancer Analysis of Advanced DiseaseThe Cancer Genome Atlas Research Network · 2021年
- 4Pan-Cancer Atlas: Integrative Analysis of Tumor DNA MethylationThe Cancer Genome Atlas Research Network · 2019年
- 5Pan-Cancer Atlas: Integrative Analysis of Tumor Mutational BurdenThe Cancer Genome Atlas Research Network · 2019年
CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录
LibriSpeech
LibriSpeech 是一个大约 1000 小时的 16kHz 英语朗读语音语料库,由 Vassil Panayotov 在 Daniel Povey 的协助下编写。数据来自 LibriVox 项目的已读有声读物,并经过仔细分割和对齐。
OpenDataLab 收录
MedDialog
MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。
github 收录
THUCNews
THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。
github 收录
长江干流实时水位观测数据集(2024年)
该数据集为长江干流主要水文站实时水位观测数据集,包含了汉口、户口、九江、宜昌等16个水文站点的逐小时或逐日水位观测数据。 该数据集包含3个excel表格文件,长江干流站点.xls,逐日水位.xlsx,逐小时水位.xlsx。
国家地球系统科学数据中心 收录