five

Flickr-Faces-HQ (FFHQ)|人脸识别数据集|生成对抗网络数据集

收藏
github2019-03-05 更新2024-05-31 收录
人脸识别
生成对抗网络
下载链接:
https://github.com/Psyche-mia/ffhq-dataset
下载链接
链接失效反馈
资源简介:
Flickr-Faces-HQ (FFHQ) 是一个高质量的人脸图像数据集,最初是为生成对抗网络(GAN)的基准而创建的。该数据集包含70,000张1024×1024分辨率的PNG图像,涵盖了年龄、种族和图像背景的显著变化,并良好地覆盖了眼镜、太阳镜、帽子等配饰。这些图像是从Flickr网站爬取的,因此继承了该网站的所有偏见,并使用dlib自动对齐和裁剪。只有使用宽松许可的图像被收集,并使用各种自动过滤器进行修剪,最后通过Amazon Mechanical Turk移除了偶尔的雕像、绘画或照片。

Flickr-Faces-HQ (FFHQ) is a high-quality facial image dataset originally created for benchmarking Generative Adversarial Networks (GANs). The dataset comprises 70,000 PNG images with a resolution of 1024×1024, showcasing significant variations in age, ethnicity, and image backgrounds, and provides good coverage of accessories such as glasses, sunglasses, and hats. These images were scraped from the Flickr website, thus inheriting all the biases of the site, and were automatically aligned and cropped using dlib. Only images under permissive licenses were collected, and various automatic filters were applied for pruning. Finally, occasional statues, paintings, or photographs were removed through Amazon Mechanical Turk.
创建时间:
2019-03-05
原始信息汇总

Flickr-Faces-HQ Dataset (FFHQ) 概述

数据集基本信息

  • 名称: Flickr-Faces-HQ Dataset (FFHQ)
  • 图像数量: 70,000
  • 图像格式: PNG
  • 分辨率: 1024×1024
  • 创建目的: 作为生成对抗网络(GAN)的基准

数据集内容

  • 图像来源: 从Flickr网站爬取,经过自动对齐和裁剪处理
  • 图像特性: 包含年龄、种族和图像背景的显著变化,以及丰富的配饰如眼镜、太阳镜、帽子等

数据集结构

  • 主文件夹: ffhq-dataset (2.56 TB)
  • 图像文件夹: images1024x1024 (89.1 GB),包含70,000张1024×1024分辨率的PNG图像
  • 缩略图文件夹: thumbnails128x128 (1.95 GB),包含70,000张128×128分辨率的PNG图像
  • 原始图像文件夹: in-the-wild-images (955 GB),包含70,000张原始Flickr图像
  • TFRecords文件夹: tfrecords (273 GB),包含用于StyleGAN和ProGAN的多分辨率数据

数据集使用

  • 训练与验证分割: 前60,000张图像用于训练,剩余10,000张用于验证
  • 无重复图像: 数据集内确保无重复图像,但in-the-wild文件夹可能包含同一图像的多个版本

下载与使用

  • 下载脚本: 提供download_ffhq.py脚本,支持自动下载、校验和重试,以及多线程下载
  • 脚本功能: 支持下载JSON元数据、1024x1024图像、128x128缩略图、原始Flickr图像和TFRecords数据

元数据信息

  • 元数据文件: ffhq-dataset-v1.json,包含每张图像的详细信息,如Flickr原图信息、对齐图像信息、缩略图信息和原始图像信息

许可证

  • 图像许可证: 根据原作者在Flickr上发布的许可证,允许免费使用、重新分发和改编(非商业用途)
  • 数据集许可证: 由NVIDIA Corporation根据Creative Commons BY-NC-SA 4.0许可证提供,允许非商业用途的使用、重新分发和改编,需适当引用原始论文并指出任何更改
AI搜集汇总
数据集介绍
main_image_url
构建方式
Flickr-Faces-HQ (FFHQ) 数据集的构建始于从 Flickr 网站上爬取高质量的人脸图像。这些图像经过 dlib 工具的自动对齐和裁剪,确保了图像的标准化和一致性。为了确保数据集的多样性和质量,使用了多种自动过滤器来筛选图像,并通过 Amazon Mechanical Turk 人工审核,以去除非人脸的图像,如雕塑、绘画等。最终,数据集包含了 70,000 张 1024×1024 分辨率的 PNG 格式图像,涵盖了不同年龄、种族和背景的多样化人脸。
特点
FFHQ 数据集以其高分辨率和多样性著称,包含了 70,000 张 1024×1024 分辨率的 PNG 图像,涵盖了广泛的年龄、种族和背景。此外,数据集还包含了丰富的配饰信息,如眼镜、帽子等。所有图像均来自 Flickr,继承了该网站的多样性,同时通过自动和人工审核确保了数据的高质量。数据集还提供了详细的元数据,包括图像的版权信息、作者、上传日期等,便于进一步的研究和应用。
使用方法
FFHQ 数据集主要用于生成对抗网络 (GAN) 的研究和训练,特别是 StyleGAN 和 ProGAN 等模型。用户可以通过提供的下载脚本从 Google Drive 获取数据集,该脚本支持多线程下载,确保高效的数据获取。数据集的元数据文件 ffhq-dataset-v1.json 包含了每张图像的详细信息,包括原始 Flickr 照片的 URL、作者信息、版权信息等。用户可以根据需要选择下载不同分辨率的图像,如 1024×1024 的原始图像或 128×128 的缩略图。此外,数据集还提供了 TFRecords 格式,便于直接用于深度学习模型的训练。
背景与挑战
背景概述
Flickr-Faces-HQ (FFHQ) 数据集是由 NVIDIA 公司于2018年创建的高质量人脸图像数据集,旨在作为生成对抗网络(GAN)的基准测试。该数据集由 Tero Karras、Samuli Laine 和 Timo Aila 等研究人员主导,包含了70,000张分辨率为1024×1024的PNG格式图像,涵盖了年龄、种族、背景和配饰(如眼镜、帽子等)的广泛变化。FFHQ 数据集的构建不仅推动了人脸生成和识别技术的发展,还为研究者提供了一个标准化的测试平台,以评估和改进GAN模型的性能。
当前挑战
FFHQ 数据集在构建过程中面临了多个挑战。首先,从 Flickr 网站爬取的图像继承了该网站的固有偏见,需要通过自动过滤和人工审核(如 Amazon Mechanical Turk)来确保数据集的质量和多样性。其次,图像的自动对齐和裁剪依赖于 dlib 库,这要求精确的面部特征点检测技术。此外,数据集的版权问题复杂,涉及多种许可协议,确保合法使用和适当归属成为一项重要任务。最后,数据集的规模和分辨率使得存储和传输成为技术上的挑战,需要高效的下载和管理工具来支持研究者的使用。
常用场景
经典使用场景
在计算机视觉领域,Flickr-Faces-HQ (FFHQ) 数据集以其高质量的人脸图像而闻名,主要用于生成对抗网络 (GAN) 的研究。该数据集包含70,000张1024×1024分辨率的PNG格式人脸图像,涵盖了年龄、种族和背景的广泛变化,以及眼镜、帽子等配饰。这些图像经过自动对齐和裁剪,适用于训练和验证GAN模型,特别是在生成逼真人脸图像方面。
衍生相关工作
基于 FFHQ 数据集,许多研究工作得以展开,特别是在生成对抗网络 (GAN) 领域。例如,StyleGAN 和 ProGAN 等模型利用该数据集进行训练,显著提升了生成图像的质量和多样性。此外,FFHQ 数据集还激发了在人脸识别、图像编辑和虚拟现实等领域的相关研究,推动了这些技术的发展和应用。这些衍生工作不仅丰富了计算机视觉的研究内容,也为实际应用提供了技术支持。
数据集最近研究
最新研究方向
在人脸识别与生成领域,Flickr-Faces-HQ (FFHQ) 数据集因其高质量和高多样性而成为前沿研究的重要基石。最新研究方向主要集中在利用FFHQ数据集改进生成对抗网络(GAN)的性能,特别是在StyleGAN架构中,研究人员致力于提升生成图像的真实度和多样性。此外,FFHQ数据集也被广泛应用于人脸属性编辑、年龄和性别预测等任务中,推动了个性化内容生成技术的发展。随着深度学习技术的进步,FFHQ数据集的应用范围不断扩大,其在增强现实、虚拟现实及人机交互等领域的潜在价值日益凸显。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

Breast Cancer Dataset

该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。

github 收录

AISHELL/AISHELL-1

Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。

hugging_face 收录

YOLO Drone Detection Dataset

为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。

github 收录

OpenSonarDatasets

OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。

github 收录