five

HyperGlobal-450K - 全球最大规模高光谱图像数据集|高光谱图像数据集|遥感技术数据集

收藏
github2024-06-19 更新2024-06-19 收录
高光谱图像
遥感技术
下载链接:
https://github.com/WHU-Sigma/HyperSIGMA
下载链接
链接失效反馈
资源简介:
HyperGlobal-450K数据集由武汉大学联合国内外多所知名高校及研究机构共同构建,是迄今为止全球规模最大的高光谱图像数据集。该数据集包含约45万张高光谱图像,规模等价于超过2000万张不重叠的三波段图像,远超现有的同类数据集。数据集涵盖了全球范围内的高光谱遥感图像,包括来自地球观测一号(EO-1)Hyperion和高分五号(GF-5B)两种传感器的图像,光谱范围从可见光到短波及中波红外,具有从紫外到长波红外的330个光谱波段,空间分辨率为30米。每幅图像经过精心处理,去除了无效波段和水汽吸收波段,保留了具有实际应用价值的光谱信息。HyperGlobal-450K数据集不仅支持高光谱图像的基础研究,还能够用于开发和测试各种高光谱图像处理方法,比如图像分类、目标检测、异常检测、变化检测、光谱解混、图像去噪和超分辨率等任务。

The HyperGlobal-450K dataset, collaboratively developed by Wuhan University along with several renowned domestic and international universities and research institutions, represents the largest hyperspectral image dataset globally to date. This dataset comprises approximately 450,000 hyperspectral images, equivalent to over 20 million non-overlapping three-band images, significantly surpassing existing datasets of its kind. It encompasses hyperspectral remote sensing images from across the globe, including those captured by the Earth Observing-1 (EO-1) Hyperion and Gaofen-5B (GF-5B) sensors. The spectral range extends from visible light to shortwave and midwave infrared, featuring 330 spectral bands from ultraviolet to longwave infrared, with a spatial resolution of 30 meters. Each image has been meticulously processed to remove invalid bands and water vapor absorption bands, retaining spectral information of practical application value. The HyperGlobal-450K dataset not only supports fundamental research in hyperspectral imaging but also facilitates the development and testing of various hyperspectral image processing methods, such as image classification, target detection, anomaly detection, change detection, spectral unmixing, image denoising, and super-resolution tasks.
提供机构:
武汉大学、重庆大学、东京大学等
创建时间:
2024-06-17
AI搜集汇总
数据集介绍
main_image_url
构建方式
在构建HyperGlobal-450K数据集时,研究团队从全球范围内收集了大量的高光谱遥感图像样本,形成了这一规模庞大的数据集。该数据集包含了超过2000万张三波段图像,显著超越了现有高光谱数据集的规模。这些图像样本涵盖了1701张图像,包括1486张EO-1和215张GF-5B,具有数百个光谱波段,为高光谱图像的深度学习模型训练提供了丰富的数据资源。
使用方法
使用HyperGlobal-450K数据集时,用户可以通过预训练和微调两种方式进行。预训练阶段,用户可以使用SLURM进行大规模的模型训练,如空间ViT和光谱ViT的预训练。微调阶段,用户可以根据具体任务需求,参考提供的README文件进行图像分类、目标检测、变化检测等任务的微调。数据集的模型权重可以通过百度网盘或Hugging Face平台下载,方便用户进行模型的进一步研究和应用。
背景与挑战
背景概述
高光谱图像(HSI)技术在遥感领域具有广泛应用,但其处理过程中存在光谱和空间冗余问题。为解决这一难题,武汉大学联合东京大学、南洋理工大学等机构的研究人员,于2024年创建了全球最大规模的高光谱图像数据集HyperGlobal-450K。该数据集包含超过2000万张三波段图像,旨在通过大规模预训练提升高光谱图像的解析能力。主要研究人员包括Di Wang、Meiqi Hu、Yao Jin等,他们提出的HyperSIGMA模型通过引入稀疏采样注意力机制,有效提升了高光谱图像的特征学习能力,对高光谱图像处理领域具有重要影响。
当前挑战
构建HyperGlobal-450K数据集面临的主要挑战包括数据采集的广泛性和多样性,确保数据质量的同时处理大量数据。此外,高光谱图像处理中的光谱和空间冗余问题也是一大挑战,HyperSIGMA模型通过稀疏采样注意力机制和光谱增强模块来解决这一问题。然而,模型的训练和优化过程复杂,需要大量的计算资源和时间,且在实际应用中如何确保模型的泛化能力和实时处理效率仍需进一步研究。
常用场景
经典使用场景
在遥感领域,HyperGlobal-450K数据集以其庞大的规模和丰富的光谱信息,成为高光谱图像(HSI)分析的经典工具。该数据集广泛应用于图像分类、目标检测、异常检测、变化检测、光谱解混、去噪和超分辨率等任务。通过提供超过2000万张三波段图像,HyperGlobal-450K为研究人员提供了前所未有的数据资源,极大地推动了高光谱图像处理技术的发展。
解决学术问题
HyperGlobal-450K数据集解决了高光谱图像处理中的多个关键学术问题。首先,它通过提供大规模、多样化的数据,有效缓解了数据稀缺性问题,促进了深度学习模型在高光谱图像分析中的应用。其次,该数据集的高光谱分辨率和空间分辨率,为研究光谱与空间特征的融合提供了理想平台,推动了高光谱图像理解技术的进步。此外,HyperGlobal-450K还为多任务学习提供了丰富的数据支持,有助于开发更加通用和高效的高光谱图像处理模型。
实际应用
在实际应用中,HyperGlobal-450K数据集被广泛用于环境监测、农业估产、城市规划、灾害评估等领域。例如,通过分析高光谱图像中的植被指数,可以实现精准农业管理;通过检测城市区域的变化,可以辅助城市规划和土地利用管理;在灾害评估中,高光谱图像可以提供详细的地表信息,帮助评估灾害影响和制定应对策略。这些应用展示了HyperGlobal-450K在实际问题解决中的巨大潜力。
数据集最近研究
最新研究方向
在遥感领域,HyperGlobal-450K数据集的最新研究方向主要集中在高光谱图像(HSI)的智能理解和处理上。该数据集支持了HyperSIGMA模型的开发,这是一个专门为HSI解释设计的基础模型。HyperSIGMA通过引入稀疏采样注意力(SSA)机制,有效解决了HSI中的光谱和空间冗余问题,提升了模型对多样上下文特征的学习能力。此外,HyperSIGMA还集成了光谱增强模块,进一步优化了空间和光谱特征的整合。这些创新使得HyperSIGMA在多种高光谱任务中表现卓越,包括图像分类、目标检测、变化检测等,显著超越了现有的最先进方法。HyperGlobal-450K数据集的广泛应用和HyperSIGMA模型的成功,为高光谱遥感技术的进一步发展提供了坚实的基础和广阔的前景。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国省级灾害统计空间分布数据集(1999-2020年)

该数据集为中国省级灾害统计空间分布数据集,时间为1999-2020年。该数据集包含中国各省自然灾害、地质灾害、地震灾害、森林火灾、森林病虫鼠害、草原灾害六类灾害的详细数据。数据量为206MB,数据格式为excel。

国家地球系统科学数据中心 收录

Plant-Diseases

Dataset for Plant Diseases containg variours Plant Disease

kaggle 收录

MedDialog

MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。

github 收录

中国1km分辨率年平均气温数据(1901-2023年)

中国1km分辨率年平均气温数据(1901-2023年)根据西北农林科技大学彭守璋研究员团队研制的1901-2023年中国1km分辨率逐月平均气温数据集进行年度均值合成后除以10将单位换算为℃得到。数据包含多个TIF文件,每个TIF文件为对应年份的年平均气温,平均气温单位为℃。彭守璋研究员在《Earth System Science Data》以论文形式发布了1 km monthly temperature and precipitation dataset for China from 1901 to 2017数据。论文链接https://doi.org/10.5194/essd-11-1931-2019。

国家地球系统科学数据中心 收录

Cultural Dimensions Dataset

该数据集包含了霍夫斯泰德文化维度理论(Hofstede's Cultural Dimensions Theory)的相关数据,涵盖了多个国家和地区的文化维度评分,如权力距离、个人主义与集体主义、男性化与女性化、不确定性规避、长期取向与短期取向等。这些数据有助于研究不同文化背景下的行为模式和价值观。

geerthofstede.com 收录