MTU-Bench|大型语言模型数据集|工具使用数据集
收藏
LibriSpeech
LibriSpeech 是一个大约 1000 小时的 16kHz 英语朗读语音语料库,由 Vassil Panayotov 在 Daniel Povey 的协助下编写。数据来自 LibriVox 项目的已读有声读物,并经过仔细分割和对齐。
OpenDataLab 收录
YOLO Drone Detection Dataset
为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。
github 收录
中国行政区划数据
本项目为中国行政区划数据,包括省级、地级、县级、乡级和村级五级行政区划数据。数据来源于国家统计局,存储格式为sqlite3 db文件,支持直接使用数据库连接工具打开。
github 收录
Google Scanned Objects (GSO)
Google Scanned Objects (GSO) 是由谷歌创建的一个高质量的3D扫描家庭物品数据集,包含超过1000个3D扫描的常用家庭物品。该数据集旨在为深度学习提供多样化的环境模拟,支持在Ignition Gazebo和Bullet模拟平台上的使用,并可轻松适配其他模拟器。GSO数据集通过定制的3D扫描硬件和高效的扫描软件创建,确保了模型的真实性和灵活性,适用于交互式模拟、合成感知和机器人学习等领域,旨在解决深度学习中环境多样性的需求。
arXiv 收录
FAOSTAT Agricultural Data
FAOSTAT Agricultural Data 是由联合国粮食及农业组织(FAO)提供的全球农业数据集。该数据集涵盖了农业生产、贸易、价格、土地利用、水资源、气候变化、人口统计等多个方面的详细信息。数据包括了全球各个国家和地区的农业统计数据,旨在为政策制定者、研究人员和公众提供全面的农业信息。
www.fao.org 收录