MIT Indoor Scenes|室内场景识别数据集|计算机视觉数据集
收藏
- MIT Indoor Scenes数据集首次发表,由麻省理工学院(MIT)的研究团队创建,旨在用于室内场景识别研究。
- 该数据集首次应用于计算机视觉领域的室内场景分类任务,展示了其在场景识别中的有效性。
- 随着深度学习技术的兴起,MIT Indoor Scenes数据集被广泛用于训练和评估卷积神经网络(CNN)在室内场景识别中的性能。
- 该数据集成为室内场景识别领域的一个基准数据集,被多个研究团队用于验证新算法和模型的有效性。
- MIT Indoor Scenes数据集的扩展版本发布,增加了更多的场景类别和图像样本,进一步丰富了数据集的内容。
- 该数据集在多个国际计算机视觉竞赛中被用作标准测试集,推动了室内场景识别技术的持续发展。
- 1Recognizing Indoor ScenesMassachusetts Institute of Technology · 2009年
- 2Indoor Segmentation and Support Inference from RGBD ImagesUniversity of Oxford · 2012年
- 3Indoor-Outdoor Image Classification Using Convolutional Neural NetworksUniversity of California, Berkeley · 2016年
- 4Deep Learning for Scene Recognition: A SurveyTsinghua University · 2018年
- 5Scene Recognition with CNNs: Objects, Scales and Dataset BiasUniversity of California, Los Angeles · 2017年
PCLT20K
PCLT20K数据集是由湖南大学等机构创建的一个大规模PET-CT肺癌肿瘤分割数据集,包含来自605名患者的21,930对PET-CT图像,所有图像都带有高质量的像素级肿瘤区域标注。该数据集旨在促进医学图像分割研究,特别是在PET-CT图像中肺癌肿瘤的分割任务。
arXiv 收录
AISHELL/AISHELL-1
Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。
hugging_face 收录
NuminaMath-CoT
数据集包含约86万道数学题目,每道题目的解答都采用思维链(Chain of Thought, CoT)格式。数据来源包括中国高中数学练习题以及美国和国际数学奥林匹克竞赛题目。数据主要从在线考试试卷PDF和数学讨论论坛收集。处理步骤包括从原始PDF中进行OCR识别、分割成问题-解答对、翻译成英文、重新对齐以生成CoT推理格式,以及最终答案格式化。
huggingface 收录
Large and Multi-modality Satellite Datasets
随着遥感数据的不断丰富和大模型技术的快速发展,大量用于预训练和图像生成等任务的大规模遥感数据集相继发布。为了便于更好地理解和利用这些数据集,我们整理并总结了目前可用的资源,特别关注全球分布和多模态数据集。
github 收录
URPC系列数据集, S-URPC2019, UDD
URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。
github 收录