five

ImageNet-1K(ILSVRC2012)|图像分类数据集|机器学习数据集

收藏
github2024-12-03 更新2024-12-06 收录
图像分类
机器学习
下载链接:
https://github.com/Shawey94/NoisyNN
下载链接
链接失效反馈
资源简介:
ImageNet-1K(ILSVRC2012)是一个大规模的图像分类数据集,包含1000个类别的图像,用于训练和验证图像分类模型。
开放时间:
2024-11-23
创建时间:
2024-11-23
原始信息汇总

NoisyNN 数据集概述

数据集

  • ImageNet-1K (ILSVRC2012)
    • 下载地址: ImageNet-1K

    • 数据结构:

      ImageNet1K/ ├── train/ │ ├── n01440764/ │ │ ├── n01440764_18.JPEG │ │ ├── n01440764_36.JPEG │ │ └── ... │ ├── n01443537/ │ └── ... │ └── n01484850/ ├── val/ │ ├── n01440764/ │ │ ├── ILSVRC2012_val_00000293.JPEG │ │ ├── ILSVRC2012_val_00002138.JPEG │ │ └── ... │ ├── n01443537/ │ └── ... │ └── n01484850/

    • 数据预处理:

      • 使用 unzip_tra.shpreprocess.py 进行数据预处理。 bash sh unzip_tra.sh python preprocess.py

训练

  • 训练命令示例:

    python Main.py --lr 0.000001 --epochs 50 --batch_size 16 --layer 11 --gpu_id 0 --res 384 --patch_size 16 --scale base --noise_type linear --datasets ImageNet --num_classes 1000 --tra 0 --inf 1 --OptimalQ 1

  • 训练命令详细说明可在 runScript.txt 中找到。

引用

  • NoisyNN:

    @article{Yu2023NoisyNN, title={NoisyNN: Exploring the Impact of Information Entropy Change in Learning Systems}, author={Yu, Xiaowei and Huang, Zhe and Xue, Yao and Zhang, Lu and Wang, Li and Liu, Tianming and Dajiang Zhu}, journal={arXiv preprint arXiv:2309.10625}, year={2023} }

  • InterLUDE:

    @article{Huang2024InterLUDE, title={InterLUDE: Interactions between Labeled and Unlabeled Data to Enhance Semi-Supervised Learning}, author={Huang, Zhe and Yu, Xiaowei and Zhu, Dajiang and Michael C. Hughes}, journal={International Conference on Machine Learning}, year={2024} }

  • FFTAT:

    @article{Yu2025FFTAT, title={Feature Fusion Transferability Aware Transformer for Unsupervised Domain Adaptation}, author={Yu, Xiaowei and Huang, Zhe and Zao Zhang}, journal={IEEE/CVF Winter Conference on Applications of Computer Vision}, year={2025} }

AI搜集汇总
数据集介绍
main_image_url
构建方式
ImageNet-1K(ILSVRC2012)数据集的构建基于大规模图像分类任务的需求,通过从ImageNet数据库中精选出1000个类别,每个类别包含约1000张图像,总计约120万张训练图像和5万张验证图像。数据集的组织结构遵循严格的层次分类体系,确保每个类别的图像具有高度的代表性和多样性。此外,数据集的预处理步骤包括图像的解压缩和标准化处理,以确保数据的质量和一致性。
特点
ImageNet-1K(ILSVRC2012)数据集以其庞大的规模和丰富的类别多样性著称,为图像分类、域适应和半监督学习等任务提供了坚实的基础。该数据集的图像质量高,分辨率多样,涵盖了从自然场景到人工制品的广泛领域。此外,数据集的标签体系完善,为深度学习模型的训练提供了精确的监督信息。
使用方法
使用ImageNet-1K(ILSVRC2012)数据集时,首先需下载数据集并按照指定结构进行组织。随后,通过执行'unzip_tra.sh'脚本和'preprocess.py'脚本进行数据预处理。在训练阶段,用户可根据需求调整学习率、批量大小等超参数,并通过'runScript.txt'中的命令启动训练过程。数据集的广泛应用使其成为评估和提升图像分类模型性能的理想选择。
背景与挑战
背景概述
ImageNet-1K(ILSVRC2012)数据集,作为计算机视觉领域的重要基准,由斯坦福大学李飞飞教授团队于2012年创建。该数据集包含1000个类别,共计120万张训练图像和5万张验证图像,极大地推动了图像分类、目标检测等任务的研究进展。其核心研究问题在于通过大规模标注数据提升模型在复杂图像识别任务中的表现,对深度学习尤其是卷积神经网络(CNN)的发展产生了深远影响。
当前挑战
尽管ImageNet-1K数据集在图像分类领域取得了显著成就,但其构建过程中仍面临诸多挑战。首先,数据标注的准确性和一致性问题,尤其是在多类别、多标签场景下。其次,数据集的规模和多样性要求高计算资源和存储空间,增加了数据处理和模型训练的复杂性。此外,随着深度学习技术的发展,如何有效利用和扩展该数据集以适应新兴任务和模型架构,也是当前研究的重要方向。
常用场景
经典使用场景
在计算机视觉领域,ImageNet-1K(ILSVRC2012)数据集因其庞大的规模和丰富的类别而成为图像分类任务的经典基准。该数据集包含1000个类别,每个类别有大约1000张图像,总计约120万张训练图像和5万张验证图像。研究人员常利用此数据集训练和评估深度学习模型,特别是卷积神经网络(CNN),以提升模型在图像识别任务中的准确性和泛化能力。
解决学术问题
ImageNet-1K数据集在解决图像分类领域的学术研究问题中发挥了关键作用。它不仅推动了深度学习模型的发展,还促进了模型在处理大规模数据集时的效率和准确性研究。通过在ImageNet-1K上的实验,学者们能够验证和比较不同模型的性能,从而推动了图像分类技术的进步。此外,该数据集还为半监督学习和领域自适应等新兴研究方向提供了宝贵的实验平台。
衍生相关工作
基于ImageNet-1K数据集,许多经典工作得以衍生和发展。例如,NoisyNN方法通过引入信息熵变化,显著提升了模型在单模态分类任务中的性能。InterLUDE和FFTAT分别在半监督学习和领域自适应领域取得了显著成果,这些工作均在顶级会议上被接受并发表。此外,ImageNet-1K还促进了诸如视觉变换器(ViT)等新型架构的研究,进一步推动了计算机视觉领域的创新和发展。
以上内容由AI搜集并总结生成