上海市2013-2017年100万森林植被类型分布图|森林资源数据集|地理信息系统数据集
收藏VisDrone2019
VisDrone2019数据集由AISKYEYE团队在天津大学机器学习和数据挖掘实验室收集,包含288个视频片段共261,908帧和10,209张静态图像。数据集覆盖了中国14个不同城市的城市和乡村环境,包括行人、车辆、自行车等多种目标,以及稀疏和拥挤场景。数据集使用不同型号的无人机在各种天气和光照条件下收集,手动标注了超过260万个目标边界框,并提供了场景可见性、对象类别和遮挡等重要属性。
github 收录
AISHELL/AISHELL-1
Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。
hugging_face 收录
stochastic/random_streetview_images_pano_v0.0.2
随机街景图像数据集是从randomstreetview.com抓取的带有标签的全景图像。每张图像显示一个可以通过Google Street View访问的位置,这些图像被大致组合以提供单个位置的约360度视角。该数据集的设计目的是仅基于其视觉内容对图像进行地理定位。数据集包含约10,000张图像,涵盖了55个国家的约175张照片,主要集中在欧洲和亚洲。
hugging_face 收录
WeChat Social Network Dataset
该数据集包含了微信社交网络的用户关系数据,包括用户之间的关注关系、互动行为等。数据集旨在帮助研究社交网络的结构和动态变化。
www.aminer.cn 收录
VGGFace2
该数据集包含9131个主体(身份)的331万张图像,平均每个主体有362.6张图像。图片是从谷歌图片搜索下载的,在姿势、年龄、光照、种族和职业(例如演员、运动员、政治家)方面有很大差异。整个数据集被分成一个训练集(包括 8631 个身份)和一个测试集(包括 500 个身份)。
OpenDataLab 收录