five

EyeDentify|瞳孔直径估计数据集|人工智能数据集

收藏
arXiv2024-07-16 更新2024-07-18 收录
瞳孔直径估计
人工智能
下载链接:
https://vijulshah.github.io/eyedentify/
下载链接
链接失效反馈
资源简介:
EyeDentify数据集由德国人工智能研究中心(DFKI)创建,专门用于基于网络摄像头图像的瞳孔直径估计。该数据集包含51名参与者的212,073张图像,通过使用Tobii眼动追踪器和内置网络摄像头进行数据收集。数据集的创建旨在解决瞳孔直径估计领域缺乏可用数据集的问题,特别是在使用标准网络摄像头数据的深度学习模型方面。EyeDentify数据集的应用领域广泛,包括理解人类活动和辅助医疗保健,旨在通过提供更易访问和广泛适用的瞳孔直径估计方法,促进相关领域的研究和发展。
提供机构:
德国人工智能研究中心 (DFKI)
创建时间:
2024-07-16
AI搜集汇总
数据集介绍
main_image_url
构建方式
EyeDentify数据集的构建主要采用了Tobii眼动追踪器和内置摄像头进行数据采集。Tobii眼动追踪器作为地面真实传感器,用于收集准确的瞳孔直径测量值,而内置摄像头则用于记录面部视频。数据采集过程中,参与者通过点击屏幕中央的按钮触发三秒的视频录制,并记录相应的开始和结束时间戳。为了确保数据的同步,Tobii眼动追踪器和摄像头记录的数据会根据时间戳进行对齐。在预处理阶段,使用MediaPipe进行人脸和眼睛检测,并对眼睛进行裁剪,同时使用眼睛特征比(EAR)和预训练的Vision Transformer模型进行眨眼检测,以排除眨眼时的帧。最终,EyeDentify数据集包含了来自51名参与者的212,073张左右眼睛图像,以及对应的瞳孔直径信息。
特点
EyeDentify数据集具有以下特点:1)它是目前最大的公开可访问的瞳孔直径数据集,为基于图像的瞳孔直径估计研究提供了丰富的数据资源;2)数据采集在自然条件下进行,参与者可以选择自己的座位位置和距离屏幕的距离,使得数据更加贴近实际应用场景;3)数据集包含了不同背景颜色下的瞳孔直径信息,为研究不同光照条件下的瞳孔变化提供了可能。
使用方法
使用EyeDentify数据集时,研究者可以将其作为训练深度学习模型的基础数据,以实现瞳孔直径的准确估计。此外,数据集还可以用于评估不同模型的性能,比较不同模型在瞳孔直径估计任务上的优劣。为了方便研究者使用,EyeDentify数据集提供了详细的文档说明,包括数据集的分布、数据预处理流程、模型训练和评估方法等。
背景与挑战
背景概述
瞳孔直径的估计对于理解生理和心理状态至关重要,但传统上这一领域主要由昂贵的专业传感器系统如Tobii主导。为了解决这一领域缺乏可用数据集的问题,Vijul Shah等人创建了一个名为EyeDentify的数据集,该数据集专门用于基于网络摄像头图像的瞳孔直径估计。该数据集的创建旨在通过提供裁剪后的眼部图像及其对应的瞳孔直径信息,使得开发和完善专门针对装备较少环境设计的模型成为可能。EyeDentify的创建不仅使得瞳孔直径估计变得更加容易获得和广泛适用,而且对理解人类活动和支持医疗保健等多个领域做出了贡献。
当前挑战
EyeDentify数据集面临的挑战包括:1) 收集地面实况数据的挑战,这通常是一个耗时且随着参与者数量增加而变得复杂的过程;2) 数据多样性的挑战,需要确保数据集在自然条件下具有广泛的适用性;3) 瞳孔直径预测本身的挑战,由于图像尺寸较小,需要进行更高分辨率的图像分析。为了克服这些挑战,EyeDentify数据集采用了传感器替换方法,使用Tobii眼动追踪器作为可靠的地面实况传感器,并通过改变计算机显示器的颜色来收集多样化的数据。此外,数据集还使用了ResNet-18和ResNet-50模型进行瞳孔直径估计,并在5折交叉验证中取得了令人满意的准确度。
常用场景
经典使用场景
EyeDentify数据集主要用于基于网络摄像头图像的瞳孔直径估计。该数据集通过提供裁剪的眼部图像及其对应的瞳孔直径信息,使得开发者和研究人员能够训练和优化模型,以实现即使在设备条件有限的场景下也能准确估计瞳孔直径的目标。
衍生相关工作
EyeDentify数据集的发布促进了一系列相关研究的发展。基于该数据集,研究人员可以训练和评估深度学习模型,以提高瞳孔直径估计的准确性和鲁棒性。此外,该数据集还支持开发瞳孔直径估计相关的应用,如智能监控系统和健康监测设备,从而推动了对人类行为和生理状态的理解。
数据集最近研究
最新研究方向
EyeDentify数据集的引入填补了基于网络摄像头图像进行瞳孔直径估计的领域空白。瞳孔直径估计对于理解生理和心理状态至关重要,但传统上依赖于昂贵的专用传感器系统,如Tobii。EyeDentify数据集通过提供裁剪后的眼部图像及其对应的瞳孔直径信息,使得开发适用于低配置环境的瞳孔直径估计模型成为可能,从而使得瞳孔直径估计更加易于获取和广泛应用,有助于理解人类行为和支持医疗保健等多个领域。该数据集还通过使用Tobii眼追踪器作为可靠的地面真实传感器,采用传感器替换方法来收集数据,克服了收集地面真实数据的挑战。此外,数据收集过程中通过改变计算机显示器的颜色,实现了数据多样性的提高,并在自然条件下收集了数据,增强了研究结果的实证效度。最后,该数据集还通过使用ResNet-18和ResNet-50模型进行初步的瞳孔直径估计,展示了模型在瞳孔直径估计方面的潜力。
相关研究论文
  • 1
    EyeDentify: A Dataset for Pupil Diameter Estimation based on Webcam Images德国人工智能研究中心 (DFKI) · 2024年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

HyperGlobal-450K - 全球最大规模高光谱图像数据集

HyperGlobal-450K数据集由武汉大学联合国内外多所知名高校及研究机构共同构建,是迄今为止全球规模最大的高光谱图像数据集。该数据集包含约45万张高光谱图像,规模等价于超过2000万张不重叠的三波段图像,远超现有的同类数据集。数据集涵盖了全球范围内的高光谱遥感图像,包括来自地球观测一号(EO-1)Hyperion和高分五号(GF-5B)两种传感器的图像,光谱范围从可见光到短波及中波红外,具有从紫外到长波红外的330个光谱波段,空间分辨率为30米。每幅图像经过精心处理,去除了无效波段和水汽吸收波段,保留了具有实际应用价值的光谱信息。HyperGlobal-450K数据集不仅支持高光谱图像的基础研究,还能够用于开发和测试各种高光谱图像处理方法,比如图像分类、目标检测、异常检测、变化检测、光谱解混、图像去噪和超分辨率等任务。

github 收录

Wind Turbine Data

该数据集包含风力涡轮机的运行数据,包括风速、风向、发电量等参数。数据记录了多个风力涡轮机在不同时间点的运行状态,适用于风能研究和风力发电系统的优化分析。

www.kaggle.com 收录

HazyDet

HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。

arXiv 收录

中国区域地面气象要素驱动数据集 v2.0(1951-2020)

中国区域地面气象要素驱动数据集(China Meteorological Forcing Data,以下简称 CMFD)是为支撑中国区域陆面、水文、生态等领域研究而研发的一套高精度、高分辨率、长时间序列数据产品。本页面发布的 CMFD 2.0 包含了近地面气温、气压、比湿、全风速、向下短波辐射通量、向下长波辐射通量、降水率等气象要素,时间分辨率为 3 小时,水平空间分辨率为 0.1°,时间长度为 70 年(1951~2020 年),覆盖了 70°E~140°E,15°N~55°N 空间范围内的陆地区域。CMFD 2.0 融合了欧洲中期天气预报中心 ERA5 再分析数据与气象台站观测数据,并在辐射、降水数据产品中集成了采用人工智能技术制作的 ISCCP-ITP-CNN 和 TPHiPr 数据产品,其数据精度较 CMFD 的上一代产品有显著提升。 CMFD 历经十余年的发展,其间发布了多个重要版本。2019 年发布的 CMFD 1.6 是完全采用传统数据融合技术制作的最后一个 CMFD 版本,而本次发布的 CMFD 2.0 则是 CMFD 转向人工智能技术制作的首个版本。此版本与 1.6 版具有相同的时空分辨率和基础变量集,但在其它诸多方面存在大幅改进。除集成了采用人工智能技术制作的辐射和降水数据外,在制作 CMFD 2.0 的过程中,研发团队尽可能采用单一来源的再分析数据作为输入并引入气象台站迁址信息,显著缓解了 CMFD 1.6 中因多源数据拼接和气象台站迁址而产生的虚假气候突变。同时,CMFD 2.0 数据的时间长度从 CMFD 1.6 的 40 年大幅扩展到了 70 年,并将继续向后延伸。CMFD 2.0 的网格空间范围虽然与 CMFD 1.6 相同,但其有效数据扩展到了中国之外,能够更好地支持跨境区域研究。为方便用户使用,CMFD 2.0 还在基础变量集之外提供了若干衍生变量,包括近地面相对湿度、雨雪分离降水产品等。此外,CMFD 2.0 摒弃了 CMFD 1.6 中通过 scale_factor 和 add_offset 参数将实型数据化为整型数据的压缩技术,转而直接将实型数据压缩存储于 NetCDF4 格式文件中,从而消除了用户使用数据时进行解压换算的困扰。 本数据集原定版本号为 1.7,但鉴于本数据集从输入数据到研制技术都较上一代数据产品有了大幅的改变,故将其版本号重新定义为 2.0。CMFD 2.0 的数据内容与此前宣传的 CMFD 1.7 基本一致,仅对 1983 年 7 月以后的向下短/长波辐射通量数据进行了更新,以修正其长期趋势存在的问题。2021 年至 2024 年的 CMFD 数据正在制作中,计划于 2025 年上半年发布,从而使 CMFD 2.0 延伸至 2024 年底。

国家青藏高原科学数据中心 收录