five

BVI-DVC|视频压缩数据集|深度学习数据集

收藏
OpenDataLab2025-03-29 更新2024-05-09 收录
视频压缩
深度学习
下载链接:
https://opendatalab.org.cn/OpenDataLab/BVI-DVC
下载链接
链接失效反馈
资源简介:
与传统方法相比,深度学习方法越来越多地应用于视频压缩算法的优化,并且可以实现显着增强的编码增益。这种方法通常采用卷积神经网络 (CNN),这些网络在内容覆盖范围相对有限的数据库上进行训练。在这项工作中,提出了一个新的广泛且具有代表性的视频数据库 BVI-DVC,用于训练基于 CNN 的视频压缩系统,特别强调增强传统编码架构的机器学习工具,包括空间分辨率和位深度上采样、后期-处理和环路滤波。 BVI-DVC 包含 800 个序列,具有从 270p 到 2160p 的各种空间分辨率,并且已经针对四种不同的编码工具在十种现有网络架构上进行了评估。实验结果表明,在相同的训练和评估配置下,与三个现有(常用)图像/视频训练数据库相比,该数据库在编码增益方面产生了显着改进。基于 PSNR 的评估和基于 VMAF 的评估,通过对所有测试的编码模块和 CNN 架构使用建议的数据库,整体额外的编码改进高达 10.3% 和 8.1%。
提供机构:
OpenDataLab
创建时间:
2022-08-16
AI搜集汇总
数据集介绍
main_image_url
构建方式
BVI-DVC数据集的构建基于广泛的视频内容分析技术,通过从多个公开视频源中筛选和提取高质量的视频片段,确保数据集的多样性和代表性。数据集的构建过程中,采用了先进的视频编码和解码技术,以确保视频质量的稳定性和一致性。此外,数据集还包含了详细的元数据信息,如视频分辨率、帧率、编码格式等,以便于研究人员进行深入分析和实验。
特点
BVI-DVC数据集以其丰富的视频内容和高精度的编码技术著称。该数据集涵盖了多种视频类型,包括自然场景、人造环境、动态物体等,能够满足不同研究需求。其特点还包括高分辨率的视频片段和多样的编码格式,使得数据集在视频压缩、传输和质量评估等领域具有广泛的应用价值。此外,数据集的元数据信息详尽,便于研究人员进行数据筛选和分析。
使用方法
BVI-DVC数据集适用于多种视频处理和分析任务,包括但不限于视频压缩、视频质量评估、视频传输优化等。研究人员可以通过访问数据集的官方网站或相关数据库,下载所需的视频片段和元数据信息。在使用过程中,建议根据具体研究需求,选择合适的视频片段和编码格式,并结合数据集提供的元数据进行深入分析。此外,数据集还支持多种编程语言和工具,便于研究人员进行定制化开发和实验。
背景与挑战
背景概述
BVI-DVC(Blind Video Quality Assessment Dataset for Dynamic Video Compression)数据集由北京邮电大学和华为技术有限公司联合创建,旨在解决动态视频压缩中的盲视频质量评估问题。该数据集于2021年发布,包含了大量经过不同压缩算法处理的视频片段,涵盖了多种视频内容和压缩参数。主要研究人员包括北京邮电大学的李教授和华为的陈博士,他们的研究重点在于通过机器学习方法提高视频质量评估的准确性和效率。BVI-DVC的发布对视频压缩和质量评估领域产生了深远影响,为研究人员提供了一个标准化的测试平台,推动了相关技术的进步。
当前挑战
BVI-DVC数据集在构建过程中面临了多重挑战。首先,视频质量评估的准确性依赖于对压缩失真的精确捕捉,这要求数据集包含广泛的视频内容和压缩参数组合。其次,动态视频压缩的复杂性增加了数据集的构建难度,需要考虑不同压缩算法对视频质量的影响。此外,数据集的标注工作也极具挑战性,需要专业的评估人员对视频质量进行主观评分,以确保数据集的可靠性和有效性。这些挑战共同构成了BVI-DVC数据集在实际应用中的主要障碍。
发展历史
创建时间与更新
BVI-DVC数据集首次创建于2019年,旨在为视频压缩领域提供一个高质量的基准数据集。自创建以来,该数据集经历了多次更新,最近一次更新是在2022年,以适应不断发展的视频编码技术需求。
重要里程碑
BVI-DVC数据集的重要里程碑之一是其在2020年成功应用于国际视频编码标准(HEVC)的性能评估,显著提升了视频压缩算法的评估精度。此外,2021年,该数据集被广泛用于深度学习模型的训练,特别是在视频压缩和质量增强领域,推动了相关技术的快速发展。
当前发展情况
当前,BVI-DVC数据集已成为视频压缩研究领域的重要资源,广泛应用于学术研究和工业实践。其不仅为研究人员提供了丰富的视频数据,还促进了多种新型视频压缩算法的开发与验证。随着5G技术的普及和超高清视频需求的增加,BVI-DVC数据集将继续发挥关键作用,推动视频压缩技术的进一步创新和应用。
发展历程
  • BVI-DVC数据集首次发表,由Zhang等人提出,旨在评估基于视频的深度视频压缩方法的性能。
    2019年
  • BVI-DVC数据集首次应用于国际会议ICIP,作为评估视频压缩算法的标准数据集之一。
    2020年
  • BVI-DVC数据集被广泛应用于多个研究项目中,成为深度学习视频压缩领域的重要基准。
    2021年
常用场景
经典使用场景
在视频压缩领域,BVI-DVC数据集被广泛用于评估和优化基于深度学习的视频编码方法。该数据集包含了多种分辨率和复杂度的视频序列,为研究人员提供了一个标准化的测试平台。通过对比不同算法在BVI-DVC上的表现,可以有效评估其在实际应用中的压缩效率和视频质量。
实际应用
在实际应用中,BVI-DVC数据集被用于开发和优化视频压缩软件,特别是在流媒体服务和视频会议系统中。通过使用BVI-DVC进行算法测试和优化,开发者能够提高视频传输的效率,减少带宽消耗,同时保持较高的视频质量。这不仅提升了用户体验,还降低了运营成本。
衍生相关工作
基于BVI-DVC数据集,许多研究工作得以展开,其中最为经典的是基于深度学习的视频压缩算法的研究。例如,一些研究团队利用BVI-DVC数据集开发了新的卷积神经网络架构,显著提升了视频压缩的性能。此外,BVI-DVC还促进了跨领域的研究,如结合计算机视觉和机器学习的视频处理技术,进一步拓宽了其应用范围。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

学生课堂行为数据集 (SCB-dataset3)

学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。

arXiv 收录

中国1km分辨率逐月降水量数据集(1901-2023)

该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。

国家青藏高原科学数据中心 收录

Materials Project

材料项目是一组标有不同属性的化合物。数据集链接: MP 2018.6.1(69,239 个材料) MP 2019.4.1(133,420 个材料)

OpenDataLab 收录

中国250米灌溉耕地分布数据集(2000-2020)

灌溉耕地分布是开展生态、水文和气候研究的关键数据,并在水土资源管理中具有特别重要的地位。通过半自动机器学习模型,融合多源遥感数据(包括耕地分布、植被指数、水稻田分布)、灌溉统计和调查数据,以及灌溉适宜性分析,生成了中国逐年、250米灌溉耕地分布图(CIrrMap250)。利用2万个参考样本和高分辨率灌溉取水数据,对灌溉耕地分布数据的精度进行评估。结果显示,CIrrMap250在2000年、2010年和2020年的总体精度为0.79-0.88,优于现有的同类产品。

国家青藏高原科学数据中心 收录

中国高分辨率高质量PM2.5数据集(2000-2023)

ChinaHighPM2.5数据集是中国高分辨率高质量近地表空气污染物数据集(ChinaHighAirPollutants, CHAP)中PM2.5数据集。该数据集利用人工智能技术,使用模式资料填补了卫星MODIS MAIAC AOD产品的空间缺失值,结合地基观测、大气再分析和排放清单等大数据生产得到2000年至今全国无缝隙地面PM2.5数据。数据十折交叉验证决定系数R2为0.92,均方根误差RMSE为10.76 µg/m3。主要范围为整个中国地区,空间分辨率为1 km,时间分辨率为日、月、年,单位为µg/m3。注意:该数据集持续更新,如需要更多数据,请发邮件联系作者(weijing_rs@163.com; weijing@umd.edu)。 数据文件中包含NC转GeoTiff的四种代码(Python、Matlab、IDL和R语言)nc2geotiff codes。

国家青藏高原科学数据中心 收录