Alzheimer DataLENS|阿尔茨海默病研究数据集|生物信息学数据集
收藏数据集概述
名称: Alzheimer DataLENS
目的: 推进阿尔茨海默病(AD)研究,通过分析、可视化和共享-omics数据。
数据类型:
- 基因表达数据: 包括60个人类微阵列表达谱数据集,涵盖多种神经退行性疾病;30+公共人类数据集,涉及19个脑区和5个队列;多个AD动物模型数据;三个单细胞RNA测序数据集。
- 蛋白质组学数据: 分析了两个蛋白质组学研究,更多研究正在进行中。
- 全基因组关联研究(GWAS): 包括国际阿尔茨海默病基因组项目(IGAP)的GWAS元分析结果和加速药物伙伴关系-阿尔茨海默病(AMP-AD)的GWAS研究结果。
- 通路分析: 包括蛋白质-蛋白质相互作用数据以及表达、表观遗传和遗传数据的整合。
数据集规模: 目前包含超过50个遗传、蛋白质组学和转录组学研究。
数据访问: 由于数据使用协议(DUAs)的限制,数据集不公开,部分数据可应请求提供。
技术平台: 使用R Shiny构建的Web应用程序,后端使用MongoDB数据库。
功能:
- 输入基因: 用户可以输入基因列表,系统将验证基因标识符。
- 差异表达分析: 用户可以选择感兴趣的基因,查看相关的差异表达分析记录。
- 交互网络: 用户可以探索基因间的相互作用,数据来自STRING数据库。
- 区域表达: 用户可以探索特定脑区域的转录组数据。
开发环境: 使用R编程语言和RStudio集成开发环境,依赖多个R包进行数据处理和可视化。
安装和部署: 需要安装R、RStudio、MongoDB等,部署建议使用Shiny Server和MongoDB Atlas。
使用指南: 用户需按照步骤输入基因、进行差异表达分析、探索交互网络和区域表达。
视频演示: 提供了一个YouTube视频链接,展示如何使用Alzheimer DataLENS。
开发者和贡献者: 由Ayush Noori创建,得到MIND Data Science Lab的支持。
参考文献: 提供了几篇与数据集相关的研究文献。

Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录
WideIRSTD Dataset
WideIRSTD数据集包含七个公开数据集:SIRST-V2、IRSTD-1K、IRDST、NUDT-SIRST、NUDT-SIRST-Sea、NUDT-MIRSDT、Anti-UAV,以及由国防科技大学团队开发的数据集,包括模拟陆基和太空基数据,以及真实手动标注的太空基数据。数据集包含具有各种目标形状(如点目标、斑点目标、扩展目标)、波长(如近红外、短波红外和热红外)、图像分辨率(如256、512、1024、3200等)的图像,以及不同的成像系统(如陆基、空基和太空基成像系统)。
github 收录
典型分布式光伏出力预测数据集
光伏电站出力数据每5分钟从电站机房监控系统获取;气象实测数据从气象站获取,气象站建于电站30号箱变附近,每5分钟将采集的数据通过光纤传输到机房;数值天气预报数据利用中国电科院新能源气象应用机房的WRF业务系统(包括30TF计算刀片机、250TB并行存储)进行中尺度模式计算后输出预报产品,每日8点前通过反向隔离装置推送到电站内网预测系统。
国家基础学科公共科学数据中心 收录
Movies Dataset
这个数据集包含电影的详细信息,包括电影名称、评分、类型、年份、发布日期、IMDb评分、投票数、导演、编剧、主演、制作国家、预算、总收入、制作公司和电影时长。
github 收录