Alzheimer DataLENS|阿尔茨海默病研究数据集|生物信息学数据集
收藏数据集概述
名称: Alzheimer DataLENS
目的: 推进阿尔茨海默病(AD)研究,通过分析、可视化和共享-omics数据。
数据类型:
- 基因表达数据: 包括60个人类微阵列表达谱数据集,涵盖多种神经退行性疾病;30+公共人类数据集,涉及19个脑区和5个队列;多个AD动物模型数据;三个单细胞RNA测序数据集。
- 蛋白质组学数据: 分析了两个蛋白质组学研究,更多研究正在进行中。
- 全基因组关联研究(GWAS): 包括国际阿尔茨海默病基因组项目(IGAP)的GWAS元分析结果和加速药物伙伴关系-阿尔茨海默病(AMP-AD)的GWAS研究结果。
- 通路分析: 包括蛋白质-蛋白质相互作用数据以及表达、表观遗传和遗传数据的整合。
数据集规模: 目前包含超过50个遗传、蛋白质组学和转录组学研究。
数据访问: 由于数据使用协议(DUAs)的限制,数据集不公开,部分数据可应请求提供。
技术平台: 使用R Shiny构建的Web应用程序,后端使用MongoDB数据库。
功能:
- 输入基因: 用户可以输入基因列表,系统将验证基因标识符。
- 差异表达分析: 用户可以选择感兴趣的基因,查看相关的差异表达分析记录。
- 交互网络: 用户可以探索基因间的相互作用,数据来自STRING数据库。
- 区域表达: 用户可以探索特定脑区域的转录组数据。
开发环境: 使用R编程语言和RStudio集成开发环境,依赖多个R包进行数据处理和可视化。
安装和部署: 需要安装R、RStudio、MongoDB等,部署建议使用Shiny Server和MongoDB Atlas。
使用指南: 用户需按照步骤输入基因、进行差异表达分析、探索交互网络和区域表达。
视频演示: 提供了一个YouTube视频链接,展示如何使用Alzheimer DataLENS。
开发者和贡献者: 由Ayush Noori创建,得到MIND Data Science Lab的支持。
参考文献: 提供了几篇与数据集相关的研究文献。

中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录
WideIRSTD Dataset
WideIRSTD数据集包含七个公开数据集:SIRST-V2、IRSTD-1K、IRDST、NUDT-SIRST、NUDT-SIRST-Sea、NUDT-MIRSDT、Anti-UAV,以及由国防科技大学团队开发的数据集,包括模拟陆基和太空基数据,以及真实手动标注的太空基数据。数据集包含具有各种目标形状(如点目标、斑点目标、扩展目标)、波长(如近红外、短波红外和热红外)、图像分辨率(如256、512、1024、3200等)的图像,以及不同的成像系统(如陆基、空基和太空基成像系统)。
github 收录
人民日报语料库 (1998.1)
本库主要提供用于NER任务的处理好的语料,包括基于词级和字级任务的NER数据。数据集包含19484个以行为粒度切分的句子,句子长度最大为659,平均长度为57.55666187641141。实体标注采用BIO格式,区分人名、地名和机构团体。
github 收录
Google Scholar
Google Scholar是一个学术搜索引擎,旨在检索学术文献、论文、书籍、摘要和文章等。它涵盖了广泛的学科领域,包括自然科学、社会科学、艺术和人文学科。用户可以通过关键词搜索、作者姓名、出版物名称等方式查找相关学术资源。
scholar.google.com 收录
CatMeows
该数据集包含440个声音样本,由21只属于两个品种(缅因州库恩猫和欧洲短毛猫)的猫在三种不同情境下发出的喵声组成。这些情境包括刷毛、在陌生环境中隔离和等待食物。每个声音文件都遵循特定的命名约定,包含猫的唯一ID、品种、性别、猫主人的唯一ID、录音场次和发声计数。此外,还有一个额外的zip文件,包含被排除的录音(非喵声)和未剪辑的连续发声序列。
huggingface 收录