five

NEU Surface Defect Database|工业检测数据集|机器学习分类数据集

收藏
kaggle2020-08-06 更新2024-03-08 收录
工业检测
机器学习分类
下载链接:
https://www.kaggle.com/datasets/kaustubhdikshit/neu-surface-defect-database
下载链接
链接失效反馈
资源简介:
Dataset for classifying 6 types of surface defects
创建时间:
2020-08-06
AI搜集汇总
数据集介绍
main_image_url
构建方式
在金属表面缺陷检测领域,NEU Surface Defect Database通过系统化的图像采集与标注流程得以构建。该数据集收集了多种工业金属材料,包括钢板、铝板等,通过高分辨率相机在不同光照条件下进行拍摄。每张图像均经过专业人员的细致标注,确保缺陷类型如划痕、凹坑、裂纹等的准确识别与分类。此外,数据集还包含了不同缺陷的尺寸、位置等详细信息,为研究者提供了丰富的实验数据。
特点
NEU Surface Defect Database以其多样性和高质量著称。首先,数据集涵盖了多种常见的金属表面缺陷,为研究提供了广泛的样本基础。其次,图像的高分辨率和多光照条件下的采集,确保了数据的全面性和真实性。此外,详细的标注信息使得该数据集在机器学习和深度学习模型的训练中具有极高的应用价值。
使用方法
NEU Surface Defect Database适用于多种金属表面缺陷检测的研究与应用。研究者可以利用该数据集进行图像处理算法的开发与优化,如边缘检测、特征提取等。同时,数据集也适用于深度学习模型的训练,如卷积神经网络(CNN),以实现自动化缺陷检测。此外,该数据集还可用于评估不同检测方法的性能,为工业生产中的质量控制提供科学依据。
背景与挑战
背景概述
NEU Surface Defect Database,由东北大学(NEU)的研究团队于2013年创建,专注于金属表面缺陷的检测与分类。该数据集的核心研究问题是如何通过图像处理技术准确识别和分类金属表面的各种缺陷,如裂纹、划痕、斑点等。这一研究不仅推动了工业自动化领域的发展,还为机器学习和计算机视觉领域的研究提供了宝贵的资源。NEU Surface Defect Database的发布,极大地促进了表面缺陷检测技术的进步,成为该领域的重要基准数据集之一。
当前挑战
NEU Surface Defect Database在构建过程中面临了多重挑战。首先,金属表面缺陷的多样性和复杂性使得图像采集和标注工作异常困难。其次,不同光照条件和拍摄角度对图像质量的影响,增加了数据预处理的复杂度。此外,数据集的规模和多样性要求高效的算法来处理和分析这些图像,以实现高精度的缺陷检测。最后,如何确保数据集的通用性和可扩展性,以适应不断变化的工业需求,也是该数据集面临的重要挑战。
发展历史
创建时间与更新
NEU Surface Defect Database创建于2013年,由东北大学(NEU)的研究团队开发。该数据集自创建以来,经历了多次更新,最近一次更新是在2020年,以确保数据集的时效性和准确性。
重要里程碑
NEU Surface Defect Database的一个重要里程碑是其在2015年的首次公开发布,这标志着该数据集在表面缺陷检测领域的广泛应用。随后,2017年,数据集的扩展版本发布,增加了更多的缺陷类型和样本数量,进一步提升了其在工业检测中的应用价值。2019年,数据集的深度学习模型训练集发布,为深度学习在表面缺陷检测中的应用提供了坚实的基础。
当前发展情况
当前,NEU Surface Defect Database已成为表面缺陷检测领域的重要参考资源,广泛应用于学术研究和工业实践。该数据集不仅为研究人员提供了丰富的数据支持,还推动了相关算法和模型的创新发展。特别是在深度学习和计算机视觉技术的推动下,NEU Surface Defect Database的应用范围不断扩大,为提高产品质量和生产效率做出了重要贡献。
发展历程
  • NEU Surface Defect Database首次发表,由东北大学(NEU)的研究团队创建,旨在为表面缺陷检测提供一个标准化的数据集。
    2013年
  • 该数据集首次应用于工业表面缺陷检测的研究中,展示了其在实际应用中的潜力。
    2015年
  • NEU Surface Defect Database被广泛应用于机器学习和计算机视觉领域的研究,成为表面缺陷检测领域的重要基准数据集。
    2017年
  • 数据集的扩展版本发布,增加了更多的缺陷类型和样本数量,进一步提升了其在学术研究和工业应用中的价值。
    2019年
  • NEU Surface Defect Database被多个国际会议和期刊引用,成为表面缺陷检测领域的重要参考资源。
    2021年
常用场景
经典使用场景
在工业制造领域,NEU Surface Defect Database 被广泛用于表面缺陷检测的研究。该数据集包含了多种金属材料的表面图像,涵盖了六种常见的缺陷类型,如划痕、凹痕、斑点等。研究者利用这些图像进行深度学习模型的训练和验证,以实现自动化、高精度的表面缺陷识别。通过对比不同算法在数据集上的表现,可以有效评估和优化缺陷检测系统的性能。
实际应用
在实际应用中,NEU Surface Defect Database 为工业制造企业提供了强大的技术支持。通过利用该数据集训练的模型,企业可以实现生产线上表面缺陷的实时检测,提高产品质量和生产效率。例如,在钢铁制造过程中,利用这些模型可以快速识别出钢板表面的划痕和凹痕,及时进行修复或剔除,避免不合格产品流入市场。此外,该数据集的应用还促进了智能制造和工业4.0的发展。
衍生相关工作
NEU Surface Defect Database 的发布催生了大量相关的经典工作。研究者们基于该数据集提出了多种改进的深度学习模型,如卷积神经网络(CNN)、生成对抗网络(GAN)等,用于提高缺陷检测的准确性和鲁棒性。此外,该数据集还激发了跨领域的研究,如结合计算机视觉和材料科学的缺陷分析方法。这些工作不仅在学术界引起了广泛关注,也为工业界提供了实用的解决方案。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

ROBEL

ROBEL是一个开源的低成本机器人平台,专为现实世界的强化学习设计。该平台由谷歌研究院和加州大学伯克利分校共同开发,包含两个机器人:D'Claw,一个三指手机器人,用于促进精细操作任务的学习;D'Kitty,一个四足机器人,用于促进敏捷的腿式移动任务学习。这些模块化机器人易于维护且足够坚固,能够承受从零开始的硬件强化学习,目前已记录超过14000小时的训练时间。ROBEL提供了一系列连续控制基准任务,这些任务具有密集和稀疏的任务目标,并引入了硬件安全评分指标。数据集和相关材料可在www.roboticsbenchmarks.org访问,旨在解决强化学习在真实机器人上的应用问题,特别是在处理物理限制和环境交互方面的挑战。

arXiv 收录

中国空气质量数据集(2014-2020年)

数据集中的空气质量数据类型包括PM2.5, PM10, SO2, NO2, O3, CO, AQI,包含了2014-2020年全国360个城市的逐日空气质量监测数据。监测数据来自中国环境监测总站的全国城市空气质量实时发布平台,每日更新。数据集的原始文件为CSV的文本记录,通过空间化处理生产出Shape格式的空间数据。数据集包括CSV格式和Shape格式两数数据格式。

国家地球系统科学数据中心 收录

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

中国区域地面气象要素驱动数据集 v2.0(1951-2020)

中国区域地面气象要素驱动数据集(China Meteorological Forcing Data,以下简称 CMFD)是为支撑中国区域陆面、水文、生态等领域研究而研发的一套高精度、高分辨率、长时间序列数据产品。本页面发布的 CMFD 2.0 包含了近地面气温、气压、比湿、全风速、向下短波辐射通量、向下长波辐射通量、降水率等气象要素,时间分辨率为 3 小时,水平空间分辨率为 0.1°,时间长度为 70 年(1951~2020 年),覆盖了 70°E~140°E,15°N~55°N 空间范围内的陆地区域。CMFD 2.0 融合了欧洲中期天气预报中心 ERA5 再分析数据与气象台站观测数据,并在辐射、降水数据产品中集成了采用人工智能技术制作的 ISCCP-ITP-CNN 和 TPHiPr 数据产品,其数据精度较 CMFD 的上一代产品有显著提升。 CMFD 历经十余年的发展,其间发布了多个重要版本。2019 年发布的 CMFD 1.6 是完全采用传统数据融合技术制作的最后一个 CMFD 版本,而本次发布的 CMFD 2.0 则是 CMFD 转向人工智能技术制作的首个版本。此版本与 1.6 版具有相同的时空分辨率和基础变量集,但在其它诸多方面存在大幅改进。除集成了采用人工智能技术制作的辐射和降水数据外,在制作 CMFD 2.0 的过程中,研发团队尽可能采用单一来源的再分析数据作为输入并引入气象台站迁址信息,显著缓解了 CMFD 1.6 中因多源数据拼接和气象台站迁址而产生的虚假气候突变。同时,CMFD 2.0 数据的时间长度从 CMFD 1.6 的 40 年大幅扩展到了 70 年,并将继续向后延伸。CMFD 2.0 的网格空间范围虽然与 CMFD 1.6 相同,但其有效数据扩展到了中国之外,能够更好地支持跨境区域研究。为方便用户使用,CMFD 2.0 还在基础变量集之外提供了若干衍生变量,包括近地面相对湿度、雨雪分离降水产品等。此外,CMFD 2.0 摒弃了 CMFD 1.6 中通过 scale_factor 和 add_offset 参数将实型数据化为整型数据的压缩技术,转而直接将实型数据压缩存储于 NetCDF4 格式文件中,从而消除了用户使用数据时进行解压换算的困扰。 本数据集原定版本号为 1.7,但鉴于本数据集从输入数据到研制技术都较上一代数据产品有了大幅的改变,故将其版本号重新定义为 2.0。CMFD 2.0 的数据内容与此前宣传的 CMFD 1.7 基本一致,仅对 1983 年 7 月以后的向下短/长波辐射通量数据进行了更新,以修正其长期趋势存在的问题。2021 年至 2024 年的 CMFD 数据正在制作中,计划于 2025 年上半年发布,从而使 CMFD 2.0 延伸至 2024 年底。

国家青藏高原科学数据中心 收录

Lifan-Z/Chinese-poetries-txt

这个数据集从《全唐诗》和《全宋诗》中提取了四种不同风格的诗歌,包括五绝(5x4)17521首、五律(5x8)60896首、七绝(7x4)84485首和七律(7x8)71818首。每行数据对应一首诗,适用于文本生成任务。

hugging_face 收录