CN-Celeb|语音识别数据集|说话人识别数据集
收藏
- CN-Celeb数据集首次发布,由清华大学语音与语言技术中心(CSLT)创建,旨在推动中文语音识别和说话人识别技术的发展。
- CN-Celeb数据集进行了首次大规模更新,增加了更多的语音样本和说话人,以提高数据集的多样性和覆盖范围。
- CN-Celeb数据集被广泛应用于多个国际语音识别和说话人识别竞赛中,展示了其在中文语音处理领域的应用价值。
- CN-Celeb数据集的开发团队发布了CN-Celeb2,这是一个扩展版本,包含了更多的说话人和更复杂的语音场景,进一步推动了中文语音技术的研究。
- 1CN-Celeb: A Challenging Chinese Speaker Recognition DatasetInstitute of Automation, Chinese Academy of Sciences · 2020年
- 2Speaker Recognition Using Deep Learning: A SurveyUniversity of Surrey, UK · 2021年
- 3Deep Speaker: An End-to-End Neural Speaker Embedding SystemCarnegie Mellon University · 2017年
- 4A Study on Speaker Recognition Using CN-Celeb DatasetTsinghua University · 2021年
- 5Speaker Diarization with LSTMGoogle · 2017年
YOLO Drone Detection Dataset
为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。
github 收录
FER2013
FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。
github 收录
Materials Project
材料项目是一组标有不同属性的化合物。数据集链接: MP 2018.6.1(69,239 个材料) MP 2019.4.1(133,420 个材料)
OpenDataLab 收录
HyperGlobal-450K - 全球最大规模高光谱图像数据集
HyperGlobal-450K数据集由武汉大学联合国内外多所知名高校及研究机构共同构建,是迄今为止全球规模最大的高光谱图像数据集。该数据集包含约45万张高光谱图像,规模等价于超过2000万张不重叠的三波段图像,远超现有的同类数据集。数据集涵盖了全球范围内的高光谱遥感图像,包括来自地球观测一号(EO-1)Hyperion和高分五号(GF-5B)两种传感器的图像,光谱范围从可见光到短波及中波红外,具有从紫外到长波红外的330个光谱波段,空间分辨率为30米。每幅图像经过精心处理,去除了无效波段和水汽吸收波段,保留了具有实际应用价值的光谱信息。HyperGlobal-450K数据集不仅支持高光谱图像的基础研究,还能够用于开发和测试各种高光谱图像处理方法,比如图像分类、目标检测、异常检测、变化检测、光谱解混、图像去噪和超分辨率等任务。
github 收录
中国区域教育数据库
该数据集包含了中国各区域的教育统计数据,涵盖了学校数量、学生人数、教师资源、教育经费等多个方面的信息。
www.moe.gov.cn 收录