five

NEU Surface Defect Database|表面缺陷检测数据集|工业检测数据集

收藏
github2024-08-17 更新2024-08-18 收录
表面缺陷检测
工业检测
下载链接:
https://github.com/Yakhyobek1997/Surface-Flaw-Detection-in-Steel-Dataset
下载链接
链接失效反馈
资源简介:
NEU Surface Defect Database包含六种常见的热轧钢带表面缺陷类型:滚入式刻度(RS)、斑块(Pa)、裂纹(Cr)、凹坑表面(PS)、夹杂物(In)和划痕(Sc)。所有图像均为灰度图像,分辨率为200x200像素,数据库包含1800张图像,每种缺陷类型有300个样本。
创建时间:
2024-08-17
AI搜集汇总
数据集介绍
main_image_url
构建方式
在构建NEU Surface Defect Database时,东北大学(NEU)精心收集并分类了六种常见的钢板表面缺陷,包括Rolled-in scale (RS)、Patches (Pa)、Crazing (Cr)、Pitted surface (PS)、Inclusion (In)和Scratches (Sc)。每种缺陷类型均包含300张灰度图像,分辨率为200x200像素,总计1800张图像。数据集的构建过程中,采用了随机抽样的方法,从每种缺陷类型中选取五张图像用于验证集,确保训练集与验证集的独立性。
特点
NEU Surface Defect Database的显著特点在于其高度的专业性和实用性。首先,该数据集涵盖了六种常见的钢板表面缺陷,为研究者提供了丰富的样本资源。其次,所有图像均为灰度格式,分辨率统一为200x200像素,确保了数据的一致性和可比性。此外,数据集的结构设计合理,包含训练集、验证集和测试集,便于模型训练和性能评估。
使用方法
使用NEU Surface Defect Database进行研究时,首先需将数据集划分为训练集和验证集。随后,可利用提供的脚本如Create_Validation_Images.ipynb进行数据预处理。在模型训练阶段,可选择U-Net架构结合ResNet34编码器,或尝试其他如FPN结合InceptionV4编码器的架构。训练过程中,通过Train_Segmentation_Model脚本启动训练,并利用Trainer.py和Data_Retriever_Seg.py进行模型管理和数据加载。训练完成后,使用Inference_Script.ipynb进行推理,生成并评估分割掩码。
背景与挑战
背景概述
近年来,钢铁工业的自动化和智能化进程加速,表面缺陷检测作为关键环节,其准确性和效率直接影响产品质量和生产成本。东北大学(NEU)推出的NEU Surface Defect Database,旨在为钢铁表面缺陷检测提供一个标准化的数据集,推动相关算法的研究与应用。该数据集收录了六种常见的热轧钢带表面缺陷,包括卷入尺度(RS)、斑块(Pa)、裂纹(Cr)、凹坑表面(PS)、夹杂物(In)和划痕(Sc),共计1800张200x200像素的灰度图像。这一数据集的发布,不仅为学术界提供了丰富的研究素材,也为工业界实现高效、精准的缺陷检测提供了技术支持。
当前挑战
尽管NEU Surface Defect Database为钢铁表面缺陷检测提供了宝贵的数据资源,但在实际应用中仍面临诸多挑战。首先,数据集中的缺陷类型多样且复杂,如何设计有效的特征提取和分类算法,以提高检测精度,是一个亟待解决的问题。其次,数据集的规模相对有限,如何在有限的样本中实现模型的泛化能力,避免过拟合,是另一个重要挑战。此外,数据集的构建过程中,图像的标注和分割工作量大且复杂,如何提高标注的准确性和效率,也是未来研究需要关注的问题。
常用场景
经典使用场景
在钢铁工业领域,NEU Surface Defect Database 数据集被广泛应用于表面缺陷检测。该数据集通过提供六种常见的热轧钢带表面缺陷图像,包括卷入的鳞片(RS)、斑点(Pa)、裂纹(Cr)、凹坑表面(PS)、夹杂物(In)和划痕(Sc),为研究人员和工程师提供了一个标准化的测试平台。这些图像均为200x200像素的灰度图像,每种缺陷类型包含300个样本,总计1800张图片。通过使用PyTorch框架,结合U-Net架构和ResNet编码器,研究人员可以训练出高效的分割模型,从而准确识别和定位钢材表面的各种缺陷。
解决学术问题
NEU Surface Defect Database 数据集在学术研究中解决了钢材表面缺陷检测的关键问题。传统的缺陷检测方法依赖于人工检查,效率低下且易受主观因素影响。该数据集通过提供高质量的缺陷图像和详细的标注信息,使得基于深度学习的自动化检测成为可能。这不仅提高了检测的准确性和效率,还为相关领域的研究提供了丰富的数据支持。此外,该数据集还促进了图像分割和目标检测算法的发展,推动了计算机视觉技术在工业检测中的应用。
衍生相关工作
NEU Surface Defect Database 数据集的发布催生了一系列相关研究和工作。例如,基于该数据集,研究人员开发了多种先进的图像分割和目标检测算法,如U-Net、FPN(特征金字塔网络)等,这些算法在其他工业检测任务中也得到了广泛应用。此外,该数据集还促进了跨学科的合作,如计算机视觉与材料科学的结合,推动了新型检测技术的研发。一些研究团队还基于该数据集开发了开源工具和平台,方便更多研究人员和工程师进行实验和应用。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

MOOCs Dataset

该数据集包含了大规模开放在线课程(MOOCs)的相关数据,包括课程信息、用户行为、学习进度等。数据主要用于研究在线教育的行为模式和学习效果。

www.kaggle.com 收录

中国省级灾害统计空间分布数据集(1999-2020年)

该数据集为中国省级灾害统计空间分布数据集,时间为1999-2020年。该数据集包含中国各省自然灾害、地质灾害、地震灾害、森林火灾、森林病虫鼠害、草原灾害六类灾害的详细数据。数据量为206MB,数据格式为excel。

国家地球系统科学数据中心 收录

Solar Radiation Data

该数据集包含全球多个地点的太阳辐射数据,涵盖了不同时间段和气象条件下的辐射强度。数据包括直接辐射、散射辐射和总辐射等指标,适用于太阳能资源评估和气候研究。

www.nrel.gov 收录

PlantVillage Dataset

该数据集包含约54,305张植物叶子的图像,这些图像在受控环境下收集,涵盖14种不同的植物种类。数据集包含38种植物疾病类别和1种背景图像。

github 收录