five

CTPelvic1K|医学影像数据集|深度学习数据集

收藏
arXiv2021-04-01 更新2024-06-21 收录
医学影像
深度学习
下载链接:
https://github.com/ICT-MIRACLE-lab/CTPelvic1K
下载链接
链接失效反馈
资源简介:
CTPelvic1K是一个由多个来源汇聚的大型骨盆CT数据集,由中国科学院计算技术研究所创建。该数据集包含1184个CT体积,总计超过32万张CT切片,涵盖了多种外观变化,如金属伪影、低剂量等。数据集的创建过程涉及专家精心标注的多骨标签,并通过迭代深度学习策略加速标注过程。CTPelvic1K数据集主要应用于骨盆疾病的临床诊断和手术规划,旨在通过深度学习方法提高骨盆骨分割的准确性和鲁棒性。
提供机构:
中国科学院计算技术研究所
创建时间:
2020-12-16
AI搜集汇总
数据集介绍
main_image_url
构建方式
CTPelvic1K数据集的构建,旨在填补现有盆腔CT图像分割数据集的空白。研究者们从多个来源收集了1,184个CT体积数据,这些数据包含了广泛的形态变化,包括金属伪影等挑战性情况。数据集的标注采用了一种迭代深度学习方法(AID),该方法首先由资深专家对少量数据进行精确标注,然后训练深度网络自动标注更多数据,最后由人工进行修正。这一过程重复迭代,直至完成所有数据的标注工作。
使用方法
使用CTPelvic1K数据集时,研究者们可以将其用于训练深度学习模型,以实现盆腔骨骼的自动分割。数据集可以按照训练集、验证集和测试集进行划分,以便于模型的训练和评估。此外,研究者们还可以利用数据集中的金属伪影数据,开发针对金属伪影的分割模型。
背景与挑战
背景概述
盆腔骨分割在CT影像分析中对于临床诊断和手术规划至关重要,尤其在骨盆疾病的治疗中。传统的分割方法往往依赖于手工分割或半自动分割技术,这些方法在面对图像外观的多样性时,如多站点领域迁移、血管对比、粪便、食物残渣、骨裂、低剂量、金属伪影等问题时,其准确性受到限制。为了解决这一问题,Pengbo Liu等人于2021年构建了CTPelvic1K数据集,该数据集由1,184个CT影像组成,涵盖了广泛的影像变化。该数据集的构建填补了深度学习方法在盆腔骨分割领域的空白,为深度学习模型提供了大量的训练数据,有助于提高模型的准确性和鲁棒性。
当前挑战
CTPelvic1K数据集在构建过程中面临了诸多挑战。首先,盆腔CT影像的多样性导致了分割任务的复杂性,需要考虑不同成像分辨率、视野、站点差异以及金属伪影等因素。其次,多类别分割问题增加了分割任务的难度,需要将盆腔分割为腰椎、骶骨、左髋骨和右髋骨等多个部分。此外,由于深度学习方法需要大量的标注数据,数据标注的准确性和效率成为了一个重要的挑战。为了解决这些挑战,研究人员提出了基于迭代深度学习的标注策略,并引入了基于符号距离函数的后处理模块,以提高分割的准确性和鲁棒性。
常用场景
经典使用场景
在医学影像分析领域,CTPelvic1K数据集广泛应用于盆腔骨分割的研究。该数据集包含了大量的CT扫描图像,涵盖了各种影像学变化,如金属伪影、低剂量扫描、对比度血管、粪石和食物残渣等。这些图像经过专家标注,涵盖了腰椎、骶骨、左髋骨和右髋骨等多个部位,为深度学习模型提供了丰富的训练数据。通过使用CTPelvic1K数据集,研究者可以训练出能够准确分割盆腔骨的深度学习模型,这对于临床诊断、手术规划和疗效评估具有重要意义。
解决学术问题
CTPelvic1K数据集解决了传统盆腔骨分割方法准确率有限的问题。传统的分割方法主要依赖于手工分割或半自动分割,这些方法在处理图像外观变化时效果不佳。CTPelvic1K数据集提供了大规模的带标注盆腔CT图像,为深度学习方法在盆腔骨分割任务中的应用提供了数据基础。通过使用该数据集,研究者可以训练出更加准确和鲁棒的盆腔骨分割模型,从而提高了盆腔骨分割的准确率和鲁棒性。
实际应用
CTPelvic1K数据集在实际应用场景中具有广泛的应用价值。通过使用该数据集训练出的盆腔骨分割模型,可以应用于临床诊断、手术规划和疗效评估等场景。例如,在临床诊断中,准确的盆腔骨分割可以帮助医生评估盆腔骨折的严重程度,并为选择合适的手术方案提供依据。在手术规划中,盆腔骨分割模型可以帮助医生进行三维重建,从而更好地进行手术规划。在疗效评估中,盆腔骨分割模型可以用于评估手术后的恢复情况。CTPelvic1K数据集的应用为临床实践提供了重要的支持。
数据集最近研究
最新研究方向
在医学影像领域,特别是骨盆骨分割方面,深度学习技术正展现出巨大的潜力。CTPelvic1K数据集的提出,填补了大规模骨盆CT数据集的空白,为研究人员提供了丰富的训练资源。该数据集包含1,184个CT体积,涵盖了多种形态变化,为深度学习模型提供了学习复杂场景的机会。基于此数据集,研究团队开发了一个多类深度网络,能够同时分割腰椎、骶骨、左髋骨和右髋骨,从而获得更有效和鲁棒的特征表示。此外,研究团队引入了基于符号距离函数(SDF)的后处理模块,进一步提高了系统的鲁棒性。CTPelvic1K数据集的开放和研究成果的发布,为骨盆骨分割领域的研究提供了新的方向和可能性,有望推动临床诊断和手术规划的自动化进程。
相关研究论文
  • 1
    Deep Learning to Segment Pelvic Bones: Large-scale CT Datasets and Baseline Models中国科学院计算技术研究所 · 2021年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国气象数据

本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。

github 收录

中国逐日降水数据集(1961-2022,0.1°/0.25°/0.5°)

CHM_PRE数据集基于中国境内及周边1961至今共2839个站点的日降水观测,在传统的“降水背景场 + 降水比值场”的数据集构建思路上,尝试应用月值降水约束和地形特征校正,并依据中国范围内约4万个高密度站点2015–2019年的日降水量插值后数据进行精度评价。经评估认为,CHM_PRE可以较好的表征降水的空间变异性,其日值时间序列与高密度站点日值降水观测结果之间的相关系数中位数为0.78,均方根误差中位数为8.8 mm/d,KGE值中位数为0.69,与目前常用的降水数据集(CGDPA、CN05.1、CMA V2.0)有很好的一致性。 数据集的时间范围为1961年至今,空间分辨率为0.1°、0.25°和0.5°,经纬度范围为18°N–54°N, 72°E–136°E。

国家青藏高原科学数据中心 收录

THCHS-30

“THCHS30是由清华大学语音与语言技术中心(CSLT)发布的开放式汉语语音数据库。原始录音是2002年在清华大学国家重点实验室的朱晓燕教授的指导下,由王东完成的。清华大学计算机科学系智能与系统,原名“TCMSD”,意思是“清华连续普通话语音数据库”,时隔13年出版,由王东博士发起,并得到了教授的支持。朱小燕。我们希望为语音识别领域的新研究人员提供一个玩具数据库。因此,该数据库对学术用户完全免费。整个软件包包含建立中文语音识别所需的全套语音和语言资源系统。”

OpenDataLab 收录

FAOSTAT Agricultural Data

FAOSTAT Agricultural Data 是由联合国粮食及农业组织(FAO)提供的全球农业数据集。该数据集涵盖了农业生产、贸易、价格、土地利用、水资源、气候变化、人口统计等多个方面的详细信息。数据包括了全球各个国家和地区的农业统计数据,旨在为政策制定者、研究人员和公众提供全面的农业信息。

www.fao.org 收录

AgiBot World

为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。

github 收录