有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
Obstacle-dataset OD
该数据集用于十五种障碍物检测,包含VOC格式和YOLO训练的.txt文件,数据集中的图像来自VOC数据集、COCO数据集、TT100K数据集以及作者团队实地收集的图片。
github 收录
LibriSpeech
LibriSpeech 是一个大约 1000 小时的 16kHz 英语朗读语音语料库,由 Vassil Panayotov 在 Daniel Povey 的协助下编写。数据来自 LibriVox 项目的已读有声读物,并经过仔细分割和对齐。
OpenDataLab 收录
TEDS
TEDS(Tencent Chinese Corpus)是由腾讯公司发布的中文文本数据集,主要用于自然语言处理和文本分类任务。该数据集包含了大量的中文文本数据,涵盖了新闻、社交媒体、论坛等多种来源,适用于训练和评估中文语言模型和文本分类模型。
ai.tencent.com 收录
Arc Virtual Cell Atlas
Arc虚拟细胞图谱是一个由高质量、经过审查的开放数据集组成的集合,旨在加速虚拟细胞模型的创建。该图谱包括来自超过3.3亿个细胞(数量还在增长)的观测数据和扰动数据。
github 收录
TT100K - Tsinghua-Tencent 100K
TT100K数据集是一个用于交通标志检测和识别的大规模数据集,包含100,000张标注的交通标志图像。该数据集主要用于计算机视觉和自动驾驶领域的研究。
cg.cs.tsinghua.edu.cn 收录