five

ShapeSplat|3D光栅化数据集|机器学习数据集

收藏
github2024-08-21 更新2024-08-22 收录
3D光栅化
机器学习
下载链接:
https://github.com/qimaqi/ShapeSplat-Gaussian_MAE
下载链接
链接失效反馈
资源简介:
ShapeSplat是一个大规模的3D高斯光栅化(3DGS)数据集,包含来自87个独特类别的65K个对象,其标签与ShapeNet和ModelNet数据集保持一致。该数据集用于无监督预训练和有监督微调,以用于分类和分割任务。
创建时间:
2024-08-20
原始信息汇总

ShapeSplat-Gaussian-MAE 数据集概述

数据集简介

ShapeSplat 是一个大规模的 3D 高斯光栅化(3DGS)数据集,使用常用的 ShapeNet 和 ModelNet 数据集构建。该数据集包含来自 87 个独特类别的 65,000 个对象,其标签与各自的数据集保持一致。创建该数据集使用了相当于 2 个 GPU 年(在 TITAN XP GPU 上)的计算量。

数据集用途

该数据集主要用于无监督预训练和有监督微调,以用于分类和分割任务。通过该数据集,研究者可以探索 3D 高斯光栅化表示空间中的 3D 理解。

数据集特点

  • 大规模: 包含 65,000 个对象。
  • 多类别: 涵盖 87 个独特类别。
  • 标签一致性: 标签与 ShapeNet 和 ModelNet 数据集保持一致。
  • 计算资源: 创建过程使用了 2 个 GPU 年的计算量。

数据集构建方法

数据集的构建方法包括:

  1. 使用 ShapeNet 和 ModelNet 数据集。
  2. 利用 3D 高斯光栅化技术生成数据。
  3. 进行无监督预训练和有监督微调。

数据集相关研究

研究者通过该数据集引入了 Gaussian-MAE,突出了从高斯参数进行表示学习的独特优势,并提供了几个有价值的见解,包括:

  1. 优化后的 GS 中心的分布与均匀采样的点云相比有显著差异。
  2. 这种分布变化在仅使用中心时导致分类任务的性能下降,但分割任务的性能提升。
  3. 提出了在归一化特征空间中进行高斯特征分组,并结合散点池化层,有效分组和嵌入相似高斯,显著提升了微调任务的性能。

数据集发布计划

  • 代码即将发布。
  • 数据集发布:正在与 ShapeNet 团队积极讨论细节,将尽快提供更新。

引用

如果该数据集对您的研究有帮助,请考虑引用以下论文:

@misc{ma2024shapesplatlargescaledatasetgaussian, title={ShapeSplat: A Large-scale Dataset of Gaussian Splats and Their Self-Supervised Pretraining}, author={Qi Ma and Yue Li and Bin Ren and Nicu Sebe and Ender Konukoglu and Theo Gevers and Luc Van Gool and Danda Pani Paudel}, year={2024}, eprint={2408.10906}, archivePrefix={arXiv}, primaryClass={cs.CV}, url={https://arxiv.org/abs/2408.10906}, }

AI搜集汇总
数据集介绍
main_image_url
构建方式
在计算机视觉领域,3D高斯溅射(3DGS)已成为多种视觉任务中的标准3D表征方法。为推动这一领域的研究,ShapeSplat数据集应运而生。该数据集通过整合ShapeNet和ModelNet两个广泛使用的数据集,构建了一个包含65,000个对象的大规模3DGS数据集。这些对象涵盖了87个独特的类别,其标签与原始数据集保持一致。数据集的构建过程涉及大量的计算资源,相当于在TITAN XP GPU上运行了两年。通过这一过程,研究者们成功地生成了一个高质量的3DGS数据集,为后续的无监督预训练和有监督微调提供了坚实的基础。
特点
ShapeSplat数据集的显著特点在于其大规模和多样性。该数据集不仅包含了65,000个3D对象,还涵盖了87个不同的类别,确保了数据的广泛覆盖和深度。此外,数据集的构建过程中采用了高斯溅射技术,这种技术能够有效地捕捉3D对象的细节和复杂性,从而为研究者提供了丰富的特征信息。数据集的标签与原始数据集保持一致,确保了数据的一致性和可靠性。这些特点使得ShapeSplat数据集成为3D视觉研究中的宝贵资源,尤其适用于分类和分割任务的预训练和微调。
使用方法
ShapeSplat数据集的使用方法相对直观。首先,用户可以从官方的ShapeNet仓库中下载数据集,部分数据可能被分割成多个压缩文件,用户可以使用提供的解压脚本进行合并。数据集以PLY格式存储,这种格式广泛用于高斯溅射,用户可以使用numpy和plyfile库加载数据。加载后,用户可以提取高斯中心、不透明度、尺度、旋转和球谐基等关键参数,这些参数为后续的分类和分割任务提供了丰富的特征。通过这些步骤,研究者可以充分利用ShapeSplat数据集进行各种3D视觉任务的研究和开发。
背景与挑战
背景概述
ShapeSplat数据集是由ETH Zürich、INSAIT Sofia University、University of Amsterdam、University of Pisa和University of Trento等多个研究机构合作创建的,旨在推动3D高斯溅射(3DGS)在视觉任务中的应用。该数据集于2024年发布,包含了从ShapeNet和ModelNet数据集中提取的65,000个对象,涵盖87个类别。ShapeSplat的构建不仅为3DGS的自监督预训练提供了丰富的资源,还为分类和分割任务的微调提供了基础。通过引入Gaussian-MAE方法,研究团队展示了从高斯参数中进行表示学习的独特优势,为3D视觉领域的进一步研究奠定了基础。
当前挑战
ShapeSplat数据集在构建过程中面临了多个挑战。首先,从ShapeNet和ModelNet数据集中提取和转换3DGS数据需要大量的计算资源,相当于2个GPU年的计算量。其次,优化后的高斯中心分布与初始点云的均匀采样存在显著差异,这导致在分类任务中性能下降,但在分割任务中性能提升。此外,如何有效利用高斯参数进行特征分组和提取,以提升微调任务的性能,也是该数据集面临的重要挑战。通过引入高斯特征分组和池化层,研究团队提供了一种针对性的解决方案,但仍需进一步优化和验证。
常用场景
经典使用场景
ShapeSplat数据集在计算机视觉领域中,主要用于3D高斯溅射(3DGS)的表示学习和自监督预训练。其经典使用场景包括但不限于:通过大规模的3DGS数据集进行无监督预训练,以提升模型在分类和分割任务中的表现。此外,ShapeSplat还支持有监督微调,通过Gaussian-MAE方法,研究人员可以深入探索高斯参数在特征提取中的独特优势,从而在实际应用中实现更高效的3D对象识别和场景理解。
实际应用
在实际应用中,ShapeSplat数据集被广泛用于增强3D视觉系统的性能,特别是在自动驾驶、机器人导航和增强现实等领域。通过利用ShapeSplat进行预训练和微调,这些系统能够更准确地识别和理解复杂的3D环境,从而提高操作的安全性和效率。此外,ShapeSplat还支持多种3D对象的快速渲染和处理,为工业设计和虚拟现实应用提供了强大的技术支持。
衍生相关工作
ShapeSplat数据集的发布催生了多项相关研究工作,特别是在3D视觉和机器学习交叉领域。例如,基于ShapeSplat的Gaussian-MAE方法已被广泛应用于各种3D对象分类和分割任务中,显著提升了模型的性能。此外,ShapeSplat还激发了关于高斯溅射参数优化和特征提取的新研究方向,推动了3D视觉技术的进一步发展。这些衍生工作不仅丰富了学术研究的内容,也为实际应用提供了更多创新解决方案。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

MOOCs Dataset

该数据集包含了大规模开放在线课程(MOOCs)的相关数据,包括课程信息、用户行为、学习进度等。数据主要用于研究在线教育的行为模式和学习效果。

www.kaggle.com 收录

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

YOLO Drone Detection Dataset

为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。

github 收录

用于陆面模拟的中国土壤数据集(第二版)

本研究对中国范围内0-2米六个标准深度层(0-5、5-15、15-30、30-60、60-100和100-200厘米)的23种土壤物理和化学属性进行了90米空间分辨率的制图。该数据集源自第二次土壤普查的8979个土壤剖面,世界土壤信息服务的1540个土壤剖面,第一次全国土壤普查的76个土壤剖面,以及区域数据库的614个土壤剖面。该数据集包括pH值、砂粒、粉粒、粘粒、容重、有机碳含量、砾石、碱解氮、总氮、阳离子交换量、孔隙度、总钾、总磷、有效钾、有效磷和土壤颜色(包括蒙赛尔颜色和RGB两种形式)。数据集的缺失值为“fillvalue = -32768”。数据集以栅格格式提供,有Tiff和netCDF两种格式。为了满足陆面建模中不同应用对空间分辨率的不同要求,CSDLv2 提供了 90 米、1 公里和 10公里空间分辨率的版本。各个土壤属性的单位参见说明文档。该数据集相对于第一版具有更好的数据质量,可广泛应用于陆面过程模拟等地学相关研究。

国家青藏高原科学数据中心 收录

UIEB, U45, LSUI

本仓库提供了水下图像增强方法和数据集的实现,包括UIEB、U45和LSUI等数据集,用于支持水下图像增强的研究和开发。

github 收录