World Cities Database - GeoNames|地理信息数据集|城市数据数据集
收藏
- GeoNames项目正式启动,旨在创建一个全球地理名称数据库,包含城市、村庄、山脉等地理实体。
- GeoNames发布首个版本,包含全球约800万个地理名称,其中涵盖了大量城市数据。
- GeoNames数据库扩展至超过1000万个地理名称,城市数据集进一步丰富,覆盖更多国家和地区的城市信息。
- GeoNames开始提供API服务,使得开发者能够更方便地访问和使用其城市数据库。
- GeoNames数据库中的城市数据集被广泛应用于地理信息系统(GIS)、导航应用和学术研究中。
- GeoNames数据库更新至包含超过1100万个地理名称,城市数据集的准确性和覆盖范围进一步提升。
- GeoNames推出新的数据更新机制,确保城市数据集能够及时反映全球城市变化和新增信息。
- GeoNames数据库中的城市数据集被用于多个全球性项目,如COVID-19疫情追踪和全球气候变化研究。
D4LA-版面分析数据集
# D4LA 文档版面分析数据集 (the most Diverse and Detailed Dataset ever for Document Layout Analysis) ## 数据集概述 D4LA是面向文档版面分析的数据集。 ### 数据集简介 包含12类文档工27类文档版面类型,详细如下:  ### 标注格式 ``` D4LA ├── train_images │ ├── 1.jpg ├── test_images │ ├── 2.jpg ├── VGT_D4LA_grid_pkl │ ├── 1.pkl │ └── 2.pkl ├── json │ ├── train.json │ └── test.json ``` ### 引用方式 If you find this repository useful, please consider citing our work: ``` @inproceedings{da2023vgt, title={Vision Grid Transformer for Document Layout Analysis}, author={Cheng Da and Chuwei Luo and Qi Zheng and Cong Yao}, year={2023}, booktitle = {ICCV}, } ``` ### Clone with HTTP ```bash git clone https://www.modelscope.cn/datasets/damo/D4LA.git ```
魔搭社区 收录
Plant-Diseases
Dataset for Plant Diseases containg variours Plant Disease
kaggle 收录
YOLO-dataset
该数据集用于训练YOLO模型,包括分类、检测和姿态识别模型。目前支持v8版本,未来计划支持更多版本。
github 收录
MedDialog
MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。
github 收录
THUCNews
THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。
github 收录