five

OCID-Ref|计算机视觉数据集|物体识别数据集

收藏
arXiv2021-04-14 更新2024-07-30 收录
计算机视觉
物体识别
下载链接:
https://github.com/lluma/OCID-Ref
下载链接
链接失效反馈
资源简介:
OCID-Ref数据集包含305,694个参照表达式,来自2,300个场景,提供RGB图像和点云输入,用于解决遮挡物体的参照表达式分割任务。
开放时间:
2021-03-13
创建时间:
2021-03-13
原始信息汇总

OCID-Ref: A 3D Robotic Dataset with Embodied Language for Clutter Scene Grounding

数据集概述

OCID-Ref 是一个包含 305,694 个引用表达式的新型数据集,源自 2,300 个场景,提供 RGB 图像和点云输入。该数据集专注于引用表达式分割任务,特别针对被遮挡物体的视觉定位。

数据集内容

  • 引用表达式数量:305,694
  • 场景数量:2,300
  • 数据类型:RGB 图像和点云

数据集下载

  • 原始 RGBD 数据:需从 OCID 下载。
  • 清理后的标注和引用表达式:可从 GDRIVE 下载。

使用说明

详细的使用说明请参考 instruction.txt

引用

@inproceedings{wang-etal-2021-ocid, title = "{OCID}-Ref: A 3{D} Robotic Dataset With Embodied Language For Clutter Scene Grounding", author = "Wang, Ke-Jyun and Liu, Yun-Hsuan and Su, Hung-Ting and Wang, Jen-Wei and Wang, Yu-Siang and Hsu, Winston and Chen, Wen-Chin", booktitle = "Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies", month = jun, year = "2021", address = "Online", publisher = "Association for Computational Linguistics", url = "https://aclanthology.org/2021.naacl-main.419", doi = "10.18653/v1/2021.naacl-main.419", pages = "5333--5338" }

许可证

该数据集遵循 MIT 许可证(详细信息见 LICENSE)。