five

Continuous Perception Benchmark|视频理解数据集|物体识别数据集

arXiv2024-08-15 更新2024-08-17 收录500
视频理解
物体识别
200条
资源简介:
Continuous Perception Benchmark数据集由斯坦福大学创建,旨在推动视频理解模型的连续感知能力。该数据集包含200个视频实例,每个视频时长20秒,帧率为30fps,涵盖10个不同的物体类别。数据集通过模拟环境OmniGibson生成,要求模型连续处理视频以准确计数特定物体,模拟人类连续视觉处理的过程。该数据集主要用于评估和促进模型在复杂视频内容中进行精确物体识别和计数的能力。
原始地址:
提供机构:
斯坦福大学
开放时间:
2024-08-15
创建时间:
2024-08-15