five

W-Bench|水印技术数据集|图像编辑数据集

收藏
arXiv2024-10-24 更新2024-10-26 收录
水印技术
图像编辑
下载链接:
https://github.com/Shilin-LU/VINE
下载链接
链接失效反馈
资源简介:
W-Bench是由南洋理工大学开发的第一个综合基准,用于评估水印方法在多种图像编辑技术下的鲁棒性。该数据集包含11种代表性的水印方法,涵盖图像再生、全局编辑、局部编辑和图像到视频生成四种编辑技术。数据集的创建过程涉及对图像编辑频率特性的分析,并利用预训练的扩散模型SDXL-Turbo进行水印嵌入。W-Bench旨在解决现有水印方法在面对大规模文本到图像模型生成的图像编辑时脆弱的问题,特别是在版权保护和知识产权验证方面。
提供机构:
南洋理工大学
创建时间:
2024-10-24
原始信息汇总

Robust Watermarking Using Generative Priors Against Image Editing: From Benchmarking to Advances

数据集概述

  • 标题: Robust Watermarking Using Generative Priors Against Image Editing: From Benchmarking to Advances
  • 作者: Shilin Lu, Zihan Zhou, Jiayou Lu, Yuanzhi Zhu, Adams Wai-Kin Kong
  • 摘要: 当前的图像水印方法在面对大规模文本到图像模型启用的先进图像编辑技术时显得脆弱。这些模型在编辑过程中可能会扭曲嵌入的水印,对版权保护构成重大挑战。本文介绍了W-Bench,这是第一个全面评估水印方法对各种图像编辑技术(包括图像再生、全局编辑、局部编辑和图像到视频生成)的鲁棒性的基准。通过对十一种代表性水印方法在常见编辑技术下的广泛评估,我们发现大多数方法在编辑后无法检测到水印。为了解决这一局限性,我们提出了VINE,一种显著增强对各种图像编辑技术鲁棒性的水印方法,同时保持高图像质量。我们的方法涉及两个关键创新:(1)我们分析了图像编辑的频率特性,并发现模糊失真具有相似的频率特性,这使我们能够在训练期间使用它们作为代理攻击来增强水印鲁棒性;(2)我们利用大规模预训练的扩散模型SDXL-Turbo,将其适应于水印任务,以实现更不可察觉和鲁棒的水印嵌入。实验结果表明,我们的方法在各种图像编辑技术下实现了出色的水印性能,在图像质量和鲁棒性方面均优于现有方法。

内容

  • 环境设置:
    • 创建Conda环境
    • 下载VINE检查点
  • 推理:
    • 水印编码
    • 图像编辑
    • 水印解码
    • 质量指标计算
    • 演示
  • W-Bench: 即将推出
  • 引用: 如果发现该仓库有用,请考虑引用

环境设置

创建Conda环境

git clone https://github.com/Shilin-LU/VINE.git conda env create -f environment.yaml conda activate vine cd diffusers pip install -e .

下载VINE检查点

模型VINE-B和VINE-R已发布,可在此处下载,并放置在./ckpt文件夹中。

推理

水印编码

使用以下命令将消息编码到图像中:

python src/watermark_encoding.py --ckpt_path ./ckpt/VINE-R
--input_path ./example/input/2.png
--output_dir ./example/watermarked_img --message Hello World!

图像编辑

提供UltraEdit和图像反演进行图像编辑,更多选项即将添加。使用以下命令编辑图像:

python src/image_editing.py --model ultraedit
--input_path ./example/watermarked_img/2_wm.png --output_dir ./example/edited_watermarked_img

水印解码

使用以下命令从已编辑的水印图像中解码消息:

python src/watermark_decoding.py --ckpt_path ./ckpt/VINE-R
--input_path ./example/edited_watermarked_img/2_wm_edit.png --groundtruth_message Hello World!

质量指标计算

使用以下命令计算单张图像的质量指标(PSNR、SSIM和LPIPS):

python src/quality_metrics.py --input_path ./example/input/2.png --wmed_input_path ./example/watermarked_img/2_wm.png

演示

提供一个完整的演示,包括水印编码、图像编辑、水印解码和质量指标计算的过程,请参考./src/demo.ipynb获取详细说明。

W-Bench

即将推出

引用

如果发现该仓库有用,请考虑引用。

AI搜集汇总
数据集介绍
main_image_url
构建方式
W-Bench数据集的构建旨在评估水印方法在面对大规模文本到图像模型驱动的图像编辑技术时的鲁棒性。该数据集首次综合考虑了四种图像编辑技术:图像再生、全局编辑、局部编辑和图像到视频生成。通过广泛评估十一种代表性水印方法在这些编辑技术下的表现,W-Bench展示了大多数方法在图像编辑后无法检测到水印的现状。为应对这一挑战,研究团队提出了VINE方法,通过分析图像编辑的频率特性并利用大规模预训练扩散模型SDXL-Turbo,显著提升了水印在各种图像编辑技术下的鲁棒性。
特点
W-Bench数据集的主要特点在于其全面性和创新性。它不仅涵盖了传统的图像再生技术,还引入了全局编辑、局部编辑和图像到视频生成等多种先进的图像编辑方法。此外,数据集通过引入模糊失真作为训练中的替代攻击,有效提升了水印的鲁棒性。VINE方法的提出,利用预训练生成模型作为强大的生成先验,使得水印嵌入更加不可察觉且鲁棒,这在现有方法中表现尤为突出。
使用方法
W-Bench数据集适用于评估和比较不同水印方法在多种图像编辑技术下的表现。研究者可以通过该数据集测试其水印方法在图像再生、全局编辑、局部编辑和图像到视频生成等任务中的鲁棒性。此外,VINE方法的具体实现和代码已在GitHub上公开,为研究者和开发者提供了实际操作的参考。通过使用W-Bench和VINE方法,研究者可以进一步优化和开发更加鲁棒的水印技术,以应对日益复杂的图像编辑挑战。
背景与挑战
背景概述
图像水印技术在版权声明和真实性验证中扮演着关键角色。传统深度学习方法在应对经典图像变换(如压缩、噪声、缩放和裁剪)方面表现出色,但近年来大规模文本到图像(T2I)模型的进步显著增强了图像编辑能力,使得这些水印方法在面对高级图像编辑技术时显得脆弱。W-Bench数据集由南洋理工大学和苏黎世联邦理工学院的研究团队于2024年引入,旨在评估水印方法对多种图像编辑技术的鲁棒性,包括图像再生、全局编辑、局部编辑和图像到视频生成。该数据集通过评估11种代表性水印方法,揭示了现有方法在图像编辑后的水印检测能力普遍不足,从而推动了VINE水印方法的发展,该方法在保持高图像质量的同时显著增强了水印的鲁棒性。
当前挑战
W-Bench数据集面临的挑战主要集中在两个方面:一是解决图像分类领域中图像水印的鲁棒性问题,特别是在面对大规模T2I模型驱动的复杂图像编辑技术时;二是在构建过程中,如何有效地模拟和评估这些高级编辑技术对水印的影响。具体挑战包括:1)如何设计能够抵抗图像再生、全局编辑、局部编辑和图像到视频生成等多种编辑技术的水印方法;2)如何在训练过程中模拟这些编辑技术,以确保水印在实际应用中的鲁棒性。此外,数据集的构建还需要考虑如何平衡水印的不可见性和鲁棒性,以及如何在保持图像质量的同时实现高效的水印嵌入和检测。
常用场景
经典使用场景
W-Bench数据集在图像水印领域中被广泛应用于评估水印方法对多种图像编辑技术的鲁棒性。其经典使用场景包括对图像再生、全局编辑、局部编辑和图像到视频生成等四种编辑技术的评估。通过这一综合基准,研究者能够系统地比较不同水印方法在这些编辑技术下的表现,从而推动水印技术的进步和优化。
衍生相关工作
W-Bench数据集的引入催生了多项相关研究工作,特别是在鲁棒水印方法的开发和评估方面。例如,基于W-Bench的研究揭示了图像编辑对高频水印模式的显著影响,推动了利用低频嵌入策略的鲁棒水印方法的发展。此外,W-Bench还促进了生成模型在水印任务中的应用,如使用预训练的扩散模型SDXL-Turbo来增强水印的不可感知性和鲁棒性,这些工作在图像水印领域具有重要的理论和实践意义。
数据集最近研究
最新研究方向
在图像水印领域,W-Bench数据集的最新研究方向聚焦于评估水印方法在面对大规模文本到图像模型驱动的图像编辑技术时的鲁棒性。研究者们通过引入W-Bench,这是首个综合性的基准测试,涵盖了图像再生、全局编辑、局部编辑和图像到视频生成等多种图像编辑技术,以全面评估水印方法的鲁棒性。实验结果表明,大多数现有的水印方法在经过这些编辑技术处理后,无法有效检测到水印。为此,研究者提出了VINE方法,通过分析图像编辑的频率特性并利用预训练的扩散模型SDXL-Turbo,显著提升了水印在各种图像编辑技术下的鲁棒性,同时保持了高图像质量。这一研究不仅推动了图像水印技术的发展,也为版权保护提供了新的技术支持。
相关研究论文
  • 1
    Robust Watermarking Using Generative Priors Against Image Editing: From Benchmarking to Advances南洋理工大学 · 2024年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

AIS数据集

该研究使用了多个公开的AIS数据集,这些数据集经过过滤、清理和统计分析。数据集涵盖了多种类型的船舶,并提供了关于船舶位置、速度和航向的关键信息。数据集包括来自19,185艘船舶的AIS消息,总计约6.4亿条记录。

github 收录

Asteroids by the Minor Planet Center

包含所有已知小行星的轨道数据和观测数据。数据来源于Minor Planet Center,格式包括Fortran (.DAT)和JSON,数据集大小为81MB(压缩)和450MB(未压缩),记录数约750,000条,每日更新。

github 收录

CE-CSL

CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。

arXiv 收录

中国行政区划shp数据

   中国行政区划数据是重要的基础地理信息数据,目前不同来源的全国行政区划数据非常多,但能够开放获取的高质量行政区域数据少之又少。基于此,锐多宝的地理空间制作一套2013-2023年可开放获取的高质量行政区划数据。该套数据以2022年国家基础地理信息数据中的县区划数据作为矢量基础,辅以高德行政区划数据、天地图行政区划数据,参考历年来民政部公布的行政区划为属性基础,具有时间跨度长、属性丰富、国界准确、更新持续等特性。   中国行政区划数据统计截止时间是2023年2月12日,包含省、市、县、国界、九段线等矢量shp数据。该数据基于2020年行政区划底图,按时间顺序依次制作了2013-2023年初的行政区划数据。截止2023年1月1日,我国共有34个省级单位,分别是4个直辖市、23个省、5个自治区和2个特别行政区。截止2023年1月1日,我国共有333个地级单位,分别是293个地级市、7个地区、30个自治州和3个盟,其中38个矢量要素未纳入统计(比如直辖市北京等、特别行政区澳门等、省直辖县定安县等)。截止2023年1月1日,我国共有2843个县级单位,分别是1301个县、394个县级市、977个市辖区、117个自治县、49个旗、3个自治旗、1个特区和1个林区,其中9个矢量要素未纳入县级类别统计范畴(比如特别行政区香港、无县级单位的地级市中山市东莞市等)。

CnOpenData 收录

AgiBot World

为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。

github 收录