ArrayExpress|基因表达数据集|功能基因组学数据集
收藏
- ArrayExpress数据集首次发布,作为欧洲生物信息学研究所(EBI)的一部分,旨在存储和分发高通量基因表达数据。
- ArrayExpress开始支持微阵列和新一代测序数据,扩展了其数据类型和应用范围。
- ArrayExpress与Gene Expression Omnibus(GEO)达成合作,促进了全球基因表达数据的标准化和互操作性。
- ArrayExpress引入MAGE-TAB格式,这是一种标准化的数据提交格式,提高了数据质量和可重复性。
- ArrayExpress数据集的存储量突破100,000个实验,成为全球最大的公共基因表达数据资源之一。
- ArrayExpress开始支持单细胞测序数据,进一步扩展了其数据类型和研究领域。
- ArrayExpress推出新的数据可视化和分析工具,增强了用户对基因表达数据的探索和理解能力。
- 1ArrayExpress--a public repository for microarray gene expression data at the EBIEuropean Molecular Biology Laboratory - European Bioinformatics Institute · 2006年
- 2ArrayExpress update--from an archive of functional genomics experiments to the atlas of gene expressionEuropean Molecular Biology Laboratory - European Bioinformatics Institute · 2009年
- 3ArrayExpress: a public repository for microarray and next-generation sequencing-based functional genomics experimentsEuropean Molecular Biology Laboratory - European Bioinformatics Institute · 2019年
MOOCs Dataset
该数据集包含了大规模开放在线课程(MOOCs)的相关数据,包括课程信息、用户行为、学习进度等。数据主要用于研究在线教育的行为模式和学习效果。
www.kaggle.com 收录
PDT Dataset
PDT数据集是由山东计算机科学中心(国家超级计算济南中心)和齐鲁工业大学(山东省科学院)联合开发的无人机目标检测数据集,专门用于检测树木病虫害。该数据集包含高分辨率和低分辨率两种版本,共计5775张图像,涵盖了健康和受病虫害影响的松树图像。数据集的创建过程包括实地采集、数据预处理和人工标注,旨在为无人机在农业中的精准喷洒提供高精度的目标检测支持。PDT数据集的应用领域主要集中在农业无人机技术,旨在提高无人机在植物保护中的目标识别精度,解决传统检测模型在实际应用中的不足。
arXiv 收录
MedChain
MedChain是由香港城市大学、香港中文大学、深圳大学、阳明交通大学和台北荣民总医院联合创建的临床决策数据集,包含12,163个临床案例,涵盖19个医学专科和156个子类别。数据集通过五个关键阶段模拟临床工作流程,强调个性化、互动性和顺序性。数据来源于中国医疗网站“iiYi”,经过专业医生验证和去识别化处理,确保数据质量和患者隐私。MedChain旨在评估大型语言模型在真实临床场景中的诊断能力,解决现有基准在个性化医疗、互动咨询和顺序决策方面的不足。
arXiv 收录
MedDialog
MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。
github 收录
LIDC-IDRI
LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。
OpenDataLab 收录