five

MAPLES-DR|糖尿病视网膜病变数据集|医学影像分析数据集

收藏
github2024-05-15 更新2024-05-31 收录
糖尿病视网膜病变
医学影像分析
下载链接:
https://github.com/LIV4D/MAPLES-DR
下载链接
链接失效反馈
资源简介:
MAPLES-DR数据集提供了198张MESSIDOR图像的DR和ME诊断以及10个视网膜结构的像素级分割图。该数据集旨在用于糖尿病视网膜病变的可解释筛查。

The MAPLES-DR dataset offers 198 MESSIDOR images with DR and ME diagnoses, along with pixel-level segmentation maps of 10 retinal structures. This dataset is designed for interpretable screening of diabetic retinopathy.
创建时间:
2023-12-16
原始信息汇总

MAPLES-DR 数据集概述

MAPLES-DR(MESSIDOR 解剖和病理标签用于可解释的糖尿病视网膜病变筛查)是一个公开数据集,提供了198张MESSIDOR图像的DR和ME诊断以及10个视网膜结构的像素级分割图。

数据集内容

  • 诊断信息:提供DR和ME的诊断。
  • 分割图:包含10个视网膜结构的像素级分割。
  • 图像来源:数据集不包含原始眼底图像,需从MESSIDOR Consortium的网站下载。

数据集获取

  • 下载地址:数据集可通过Figshare下载。

引用信息

  • 引用文献:若在学术工作中使用此数据集,请引用以下文献: bibtex @article{maples_dr, title={MAPLES-DR: MESSIDOR Anatomical and Pathological Labels for Explainable Screening of Diabetic Retinopathy}, author={Gabriel Lepetit-Aimon and Clément Playout and Marie Carole Boucher and Renaud Duval and Michael H Brent and Farida Cheriet}, year={2024}, eprint={2402.04258}, archivePrefix={arXiv}, doi={10.48550/arXiv.2402.04258} }

使用工具

  • Python库:提供maples_dr Python库,用于简化数据集的下载和使用。
    • 安装命令: bash pip install maples-dr

    • 示例用法: python import maples_dr train_set = maples_dr.load_train_set() test_set = maples_dr.load_test_set()

示例和文档

  • 示例Notebooks:包含在examples/目录中,展示如何使用maples_dr Python库。
  • 详细文档:提供关于配置图像分辨率和格式、包含眼底图像与标签等高级功能的详细信息。

致谢

  • 贡献者:感谢多位专家在标注MAPLES-DR数据集上的贡献。
  • 资助:此研究由加拿大自然科学与工程研究委员会、Diabetes Action Canada和FROUM资助。
  • 原始数据来源:感谢Messidor项目合作伙伴提供的原始MESSIDOR数据集。
AI搜集汇总
数据集介绍
main_image_url
构建方式
MAPLES-DR数据集的构建基于MESSIDOR数据集,通过专业医疗人员的细致标注,为198张眼底图像提供了糖尿病视网膜病变(DR)和黄斑水肿(ME)的诊断信息,以及10种视网膜结构的像素级分割图。这一过程确保了数据集的高质量和临床相关性,为机器学习应用提供了丰富的标注数据。
特点
MAPLES-DR数据集的显著特点在于其高精度的像素级分割图和详细的病理诊断信息,这些信息为解释性筛查糖尿病视网膜病变提供了坚实的基础。此外,数据集的结构化设计使得其易于集成到机器学习模型中,支持多种应用场景,如疾病筛查和病理分析。
使用方法
使用MAPLES-DR数据集时,用户可以通过`maples_dr` Python库轻松下载和加载数据。该库支持自动下载、解压和本地缓存数据集,并提供简单的API接口以访问训练集和测试集。用户还可以选择将数据导出到本地文件夹,以便进行进一步的分析和处理。详细的文档和示例代码进一步简化了数据集的使用流程。
背景与挑战
背景概述
MAPLES-DR数据集,全称为MESSIDOR Anatomical and Pathological Labels for Explainable Screening of Diabetic Retinopathy,是由Gabriel Lepetit-Aimon及其团队在2024年创建的公开数据集。该数据集专注于糖尿病视网膜病变(Diabetic Retinopathy, DR)的筛查与解释,提供了198张MESSIDOR数据集图像的DR和ME诊断,以及10种视网膜结构的像素级分割图。MAPLES-DR的开发旨在通过提供详细的解剖和病理标签,推动机器学习在眼科疾病筛查中的应用,特别是在解释性筛查方面。该数据集的发布对眼科医学和计算机视觉领域具有重要影响,为研究人员提供了一个标准化的工具,以开发和验证新的诊断算法。
当前挑战
MAPLES-DR数据集在构建过程中面临多项挑战。首先,像素级分割图的生成需要高度专业化的医学知识和精细的技术,以确保分割的准确性和可靠性。其次,数据集的标注工作涉及多位专家的参与,确保了标注的一致性和质量,但也增加了数据集构建的复杂性和成本。此外,数据集的规模相对较小,仅包含198张图像,这在一定程度上限制了其在深度学习模型训练中的应用。最后,数据集的发布和维护需要持续的技术支持和更新,以适应不断发展的研究需求和技术进步。
常用场景
经典使用场景
在眼科医学领域,MAPLES-DR数据集的经典使用场景主要集中在糖尿病视网膜病变(DR)和黄斑水肿(ME)的诊断与解释性筛查。该数据集提供了198张眼底图像的像素级分割图,涵盖了10种视网膜结构,为机器学习模型在DR和ME的自动检测与分类提供了丰富的标注数据。通过这些标注,研究人员可以开发和验证基于深度学习的诊断算法,从而提高筛查效率和准确性。
实际应用
在实际应用中,MAPLES-DR数据集被广泛用于开发和优化糖尿病视网膜病变和黄斑水肿的自动筛查系统。这些系统可以部署在眼科诊所和医院,帮助医生快速、准确地评估患者的视网膜健康状况,从而及时进行干预和治疗。此外,该数据集还支持远程医疗应用,使得偏远地区的患者也能享受到高质量的眼科筛查服务,显著提升了医疗资源的可及性和效率。
衍生相关工作
基于MAPLES-DR数据集,研究者们开展了一系列相关工作,包括但不限于开发新的深度学习模型、优化图像分割算法以及评估不同模型的性能。例如,有研究利用该数据集训练卷积神经网络(CNN),以提高病变检测的准确性;还有研究通过对比不同分割算法的性能,提出了改进的分割方法。这些工作不仅推动了眼科医学的自动化进程,也为其他医学图像分析领域提供了宝贵的经验和方法。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

YOLO Drone Detection Dataset

为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。

github 收录

基于站点观测的中国1km土壤湿度日尺度数据集(2000-2022)

本研究提供了中国范围1km高质量的土壤湿度数据集-SMCI1.0(Soil Moisture of China by in situ data, version 1.0),SMCI1.0是包含2000-2022年、日尺度、以10厘米为间隔10层深度(10-100cm)的高时空分辨率土壤湿度,数据单位为0.001m³/m³,缺失值为-999,投影为WGS1984。该数据集是以中国气象局提供的1,648个站点观测10层土壤湿度作为基准,使用ERA5_Land气象强迫数据、叶面积指数(LAI)、土地覆盖类型(Landtypes)、地形(DEM)和土壤特性(Soil properties)作为协变量,通过机器学习方式获得。本研究进行了两组实验以验证SMCI1.0的精度,时间尺度上:ubRMSE为0.041-0.052,R为0.883-0.919;空间尺度上:ubRMSE为0.045-0.051,R为0.866-0.893。 由于SMCI1.0是基于实地观测的土壤湿度,它可以作为现有基于模型和卫星数据集的有效补充。该数据产品可用于各种水文、气象、生态分析和建模,尤其在需要高质量、高分辨率土壤湿度的应用上至关重要。有关数据集的引用及详细描述,请阅读说明文档。为便于使用,本研究提供了两种不同分辨率的版本:30 秒(~1km)和0.1度(~9km)。

国家青藏高原科学数据中心 收录

中文《诗歌总集》

这是一个收录所有中文诗词的数据集,旨在提供一个系统、完善、高质量的诗词数据集合。数据集包括诗词的收录、校正、鉴赏和评分,并标准化为统一的JSON格式。

github 收录