GTEx|基因表达数据集|基因型分析数据集
收藏
- GTEx项目正式启动,旨在研究基因表达在不同人体组织中的变异情况。
- 首次发布GTEx数据集,包含来自53个组织的7000多个样本的基因表达数据。
- GTEx数据集更新,增加了更多样本和组织类型,进一步丰富了基因表达数据的多样性。
- GTEx项目发布第四版数据集,包含超过17000个样本,覆盖80多种组织类型,成为全球最大的基因表达数据库之一。
- 1The Genotype-Tissue Expression (GTEx) pilot analysis: Multitissue gene regulation in humansBroad Institute of MIT and Harvard · 2015年
- 2Genetic effects on gene expression across human tissuesBroad Institute of MIT and Harvard · 2017年
- 3The impact of tissue heterogeneity on gene expression profiles in the Genotype-Tissue Expression (GTEx) projectUniversity of California, San Diego · 2020年
- 4A survey of best practices for RNA-seq data analysisUniversity of California, Riverside · 2016年
- 5Genetic regulatory effects on gene expression in human tissuesBroad Institute of MIT and Harvard · 2019年
CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录
PDT Dataset
PDT数据集是由山东计算机科学中心(国家超级计算济南中心)和齐鲁工业大学(山东省科学院)联合开发的无人机目标检测数据集,专门用于检测树木病虫害。该数据集包含高分辨率和低分辨率两种版本,共计5775张图像,涵盖了健康和受病虫害影响的松树图像。数据集的创建过程包括实地采集、数据预处理和人工标注,旨在为无人机在农业中的精准喷洒提供高精度的目标检测支持。PDT数据集的应用领域主要集中在农业无人机技术,旨在提高无人机在植物保护中的目标识别精度,解决传统检测模型在实际应用中的不足。
arXiv 收录
Subway Dataset
该数据集包含了全球多个城市的地铁系统数据,包括车站信息、线路图、列车时刻表、乘客流量等。数据集旨在帮助研究人员和开发者分析和模拟城市交通系统,优化地铁运营和乘客体验。
www.kaggle.com 收录
Breast Cancer Dataset
该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。
github 收录
NASA Battery Dataset
用于预测电池健康状态的数据集,由NASA提供。
github 收录