MAPLES-DR|糖尿病视网膜病变数据集|医学影像分析数据集
收藏MAPLES-DR 数据集概述
MAPLES-DR(MESSIDOR 解剖和病理标签用于可解释的糖尿病视网膜病变筛查)是一个公开数据集,提供了198张MESSIDOR图像的DR和ME诊断以及10个视网膜结构的像素级分割图。
数据集内容
- 诊断信息:提供DR和ME的诊断。
- 分割图:包含10个视网膜结构的像素级分割。
- 图像来源:数据集不包含原始眼底图像,需从MESSIDOR Consortium的网站下载。
数据集获取
- 下载地址:数据集可通过Figshare下载。
引用信息
- 引用文献:若在学术工作中使用此数据集,请引用以下文献: bibtex @article{maples_dr, title={MAPLES-DR: MESSIDOR Anatomical and Pathological Labels for Explainable Screening of Diabetic Retinopathy}, author={Gabriel Lepetit-Aimon and Clément Playout and Marie Carole Boucher and Renaud Duval and Michael H Brent and Farida Cheriet}, year={2024}, eprint={2402.04258}, archivePrefix={arXiv}, doi={10.48550/arXiv.2402.04258} }
使用工具
- Python库:提供
maples_dr
Python库,用于简化数据集的下载和使用。-
安装命令: bash pip install maples-dr
-
示例用法: python import maples_dr train_set = maples_dr.load_train_set() test_set = maples_dr.load_test_set()
-
示例和文档
- 示例Notebooks:包含在
examples/
目录中,展示如何使用maples_dr
Python库。 - 详细文档:提供关于配置图像分辨率和格式、包含眼底图像与标签等高级功能的详细信息。
致谢
- 贡献者:感谢多位专家在标注MAPLES-DR数据集上的贡献。
- 资助:此研究由加拿大自然科学与工程研究委员会、Diabetes Action Canada和FROUM资助。
- 原始数据来源:感谢Messidor项目合作伙伴提供的原始MESSIDOR数据集。

LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
中国1km分辨率逐月降水量数据集(1901-2023)
该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。
国家青藏高原科学数据中心 收录
YOLO Drone Detection Dataset
为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。
github 收录
基于站点观测的中国1km土壤湿度日尺度数据集(2000-2022)
本研究提供了中国范围1km高质量的土壤湿度数据集-SMCI1.0(Soil Moisture of China by in situ data, version 1.0),SMCI1.0是包含2000-2022年、日尺度、以10厘米为间隔10层深度(10-100cm)的高时空分辨率土壤湿度,数据单位为0.001m³/m³,缺失值为-999,投影为WGS1984。该数据集是以中国气象局提供的1,648个站点观测10层土壤湿度作为基准,使用ERA5_Land气象强迫数据、叶面积指数(LAI)、土地覆盖类型(Landtypes)、地形(DEM)和土壤特性(Soil properties)作为协变量,通过机器学习方式获得。本研究进行了两组实验以验证SMCI1.0的精度,时间尺度上:ubRMSE为0.041-0.052,R为0.883-0.919;空间尺度上:ubRMSE为0.045-0.051,R为0.866-0.893。 由于SMCI1.0是基于实地观测的土壤湿度,它可以作为现有基于模型和卫星数据集的有效补充。该数据产品可用于各种水文、气象、生态分析和建模,尤其在需要高质量、高分辨率土壤湿度的应用上至关重要。有关数据集的引用及详细描述,请阅读说明文档。为便于使用,本研究提供了两种不同分辨率的版本:30 秒(~1km)和0.1度(~9km)。
国家青藏高原科学数据中心 收录
中文《诗歌总集》
这是一个收录所有中文诗词的数据集,旨在提供一个系统、完善、高质量的诗词数据集合。数据集包括诗词的收录、校正、鉴赏和评分,并标准化为统一的JSON格式。
github 收录