Flickr-Faces-HQ (FFHQ)|人脸识别数据集|生成对抗网络数据集
收藏Flickr-Faces-HQ Dataset (FFHQ) 概述
数据集基本信息
- 名称: Flickr-Faces-HQ Dataset (FFHQ)
- 图像数量: 70,000
- 图像格式: PNG
- 分辨率: 1024×1024
- 创建目的: 作为生成对抗网络(GAN)的基准
数据集内容
- 图像来源: 从Flickr网站爬取,经过自动对齐和裁剪处理
- 图像特性: 包含年龄、种族和图像背景的显著变化,以及丰富的配饰如眼镜、太阳镜、帽子等
数据集结构
- 主文件夹: ffhq-dataset (2.56 TB)
- 图像文件夹: images1024x1024 (89.1 GB),包含70,000张1024×1024分辨率的PNG图像
- 缩略图文件夹: thumbnails128x128 (1.95 GB),包含70,000张128×128分辨率的PNG图像
- 原始图像文件夹: in-the-wild-images (955 GB),包含70,000张原始Flickr图像
- TFRecords文件夹: tfrecords (273 GB),包含用于StyleGAN和ProGAN的多分辨率数据
数据集使用
- 训练与验证分割: 前60,000张图像用于训练,剩余10,000张用于验证
- 无重复图像: 数据集内确保无重复图像,但
in-the-wild
文件夹可能包含同一图像的多个版本
下载与使用
- 下载脚本: 提供
download_ffhq.py
脚本,支持自动下载、校验和重试,以及多线程下载 - 脚本功能: 支持下载JSON元数据、1024x1024图像、128x128缩略图、原始Flickr图像和TFRecords数据
元数据信息
- 元数据文件: ffhq-dataset-v1.json,包含每张图像的详细信息,如Flickr原图信息、对齐图像信息、缩略图信息和原始图像信息
许可证
- 图像许可证: 根据原作者在Flickr上发布的许可证,允许免费使用、重新分发和改编(非商业用途)
- 数据集许可证: 由NVIDIA Corporation根据Creative Commons BY-NC-SA 4.0许可证提供,允许非商业用途的使用、重新分发和改编,需适当引用原始论文并指出任何更改

LFW
人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download
AI_Studio 收录
Breast Cancer Dataset
该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。
github 收录
AISHELL/AISHELL-1
Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。
hugging_face 收录
YOLO Drone Detection Dataset
为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。
github 收录
OpenSonarDatasets
OpenSonarDatasets是一个致力于整合开放源代码声纳数据集的仓库,旨在为水下研究和开发提供便利。该仓库鼓励研究人员扩展当前的数据集集合,以增加开放源代码声纳数据集的可见性,并提供一个更容易查找和比较数据集的方式。
github 收录