W-Bench|水印技术数据集|图像编辑数据集
收藏Robust Watermarking Using Generative Priors Against Image Editing: From Benchmarking to Advances
数据集概述
- 标题: Robust Watermarking Using Generative Priors Against Image Editing: From Benchmarking to Advances
- 作者: Shilin Lu, Zihan Zhou, Jiayou Lu, Yuanzhi Zhu, Adams Wai-Kin Kong
- 摘要: 当前的图像水印方法在面对大规模文本到图像模型启用的先进图像编辑技术时显得脆弱。这些模型在编辑过程中可能会扭曲嵌入的水印,对版权保护构成重大挑战。本文介绍了W-Bench,这是第一个全面评估水印方法对各种图像编辑技术(包括图像再生、全局编辑、局部编辑和图像到视频生成)的鲁棒性的基准。通过对十一种代表性水印方法在常见编辑技术下的广泛评估,我们发现大多数方法在编辑后无法检测到水印。为了解决这一局限性,我们提出了VINE,一种显著增强对各种图像编辑技术鲁棒性的水印方法,同时保持高图像质量。我们的方法涉及两个关键创新:(1)我们分析了图像编辑的频率特性,并发现模糊失真具有相似的频率特性,这使我们能够在训练期间使用它们作为代理攻击来增强水印鲁棒性;(2)我们利用大规模预训练的扩散模型SDXL-Turbo,将其适应于水印任务,以实现更不可察觉和鲁棒的水印嵌入。实验结果表明,我们的方法在各种图像编辑技术下实现了出色的水印性能,在图像质量和鲁棒性方面均优于现有方法。
内容
- 环境设置:
- 创建Conda环境
- 下载VINE检查点
- 推理:
- 水印编码
- 图像编辑
- 水印解码
- 质量指标计算
- 演示
- W-Bench: 即将推出
- 引用: 如果发现该仓库有用,请考虑引用
环境设置
创建Conda环境
git clone https://github.com/Shilin-LU/VINE.git conda env create -f environment.yaml conda activate vine cd diffusers pip install -e .
下载VINE检查点
模型VINE-B和VINE-R已发布,可在此处下载,并放置在./ckpt
文件夹中。
推理
水印编码
使用以下命令将消息编码到图像中:
python src/watermark_encoding.py --ckpt_path ./ckpt/VINE-R
--input_path ./example/input/2.png
--output_dir ./example/watermarked_img
--message Hello World!
图像编辑
提供UltraEdit和图像反演进行图像编辑,更多选项即将添加。使用以下命令编辑图像:
python src/image_editing.py --model ultraedit
--input_path ./example/watermarked_img/2_wm.png
--output_dir ./example/edited_watermarked_img
水印解码
使用以下命令从已编辑的水印图像中解码消息:
python src/watermark_decoding.py --ckpt_path ./ckpt/VINE-R
--input_path ./example/edited_watermarked_img/2_wm_edit.png
--groundtruth_message Hello World!
质量指标计算
使用以下命令计算单张图像的质量指标(PSNR、SSIM和LPIPS):
python src/quality_metrics.py --input_path ./example/input/2.png --wmed_input_path ./example/watermarked_img/2_wm.png
演示
提供一个完整的演示,包括水印编码、图像编辑、水印解码和质量指标计算的过程,请参考./src/demo.ipynb
获取详细说明。
W-Bench
即将推出
引用
如果发现该仓库有用,请考虑引用。

- 1Robust Watermarking Using Generative Priors Against Image Editing: From Benchmarking to Advances南洋理工大学 · 2024年
AIS数据集
该研究使用了多个公开的AIS数据集,这些数据集经过过滤、清理和统计分析。数据集涵盖了多种类型的船舶,并提供了关于船舶位置、速度和航向的关键信息。数据集包括来自19,185艘船舶的AIS消息,总计约6.4亿条记录。
github 收录
Asteroids by the Minor Planet Center
包含所有已知小行星的轨道数据和观测数据。数据来源于Minor Planet Center,格式包括Fortran (.DAT)和JSON,数据集大小为81MB(压缩)和450MB(未压缩),记录数约750,000条,每日更新。
github 收录
CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录
中国行政区划shp数据
中国行政区划数据是重要的基础地理信息数据,目前不同来源的全国行政区划数据非常多,但能够开放获取的高质量行政区域数据少之又少。基于此,锐多宝的地理空间制作一套2013-2023年可开放获取的高质量行政区划数据。该套数据以2022年国家基础地理信息数据中的县区划数据作为矢量基础,辅以高德行政区划数据、天地图行政区划数据,参考历年来民政部公布的行政区划为属性基础,具有时间跨度长、属性丰富、国界准确、更新持续等特性。 中国行政区划数据统计截止时间是2023年2月12日,包含省、市、县、国界、九段线等矢量shp数据。该数据基于2020年行政区划底图,按时间顺序依次制作了2013-2023年初的行政区划数据。截止2023年1月1日,我国共有34个省级单位,分别是4个直辖市、23个省、5个自治区和2个特别行政区。截止2023年1月1日,我国共有333个地级单位,分别是293个地级市、7个地区、30个自治州和3个盟,其中38个矢量要素未纳入统计(比如直辖市北京等、特别行政区澳门等、省直辖县定安县等)。截止2023年1月1日,我国共有2843个县级单位,分别是1301个县、394个县级市、977个市辖区、117个自治县、49个旗、3个自治旗、1个特区和1个林区,其中9个矢量要素未纳入县级类别统计范畴(比如特别行政区香港、无县级单位的地级市中山市东莞市等)。
CnOpenData 收录
AgiBot World
为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。
github 收录