five

Fields of The World (FTW) |农业监测数据集|地理空间分析数据集

收藏
arXiv2024-09-24 更新2024-09-25 收录
农业监测
地理空间分析
下载链接:
https://github.com/fieldsoftheworld/ftw-baselines
下载链接
链接失效反馈
资源简介:
Fields of The World (FTW)数据集由亚利桑那州立大学、微软AI for Good研究实验室、泰勒地理空间研究所和华盛顿大学联合创建,旨在推动全球农业田块边界的自动提取技术。该数据集覆盖了24个国家,横跨欧洲、非洲、亚洲和南美洲四大洲,是一个前所未有的大规模、多样化农业领域实例分割的基准数据集。FTW数据集包含70,462个样本,每个样本均包含有实例和语义分割掩码,与多时相、多光谱的Sentinel-2卫星图像相匹配。数据集的规模是以往任何类似数据集的十倍,覆盖了166,293平方千米的地理区域。创建过程中,研究团队从政府数据库、已发表文献和网站等来源进行了全面的搜索,以确保数据集具有全球多样性和高质量。此数据集不仅为农业监测和评估提供了基础数据支持,还对可持续发展、土地管理、气候变化政策和项目具有重要意义。它能够促进不同建模方法的一致性评估,并为下游用户提供了现实场景相关的真实世界基准任务。
提供机构:
亚利桑那州立大学等
创建时间:
2024-09-24
AI搜集汇总
数据集介绍
main_image_url
构建方式
Fields of The World (FTW) 数据集的构建基于全球24个国家的农业田地边界数据,涵盖欧洲、非洲、亚洲和南美洲四个大洲。数据集的构建过程包括从政府数据库、已发表文献和其他网站中广泛搜集田地多边形数据,确保数据的地理多样性、高质量和可重复使用性。此外,数据集还采用了多光谱Sentinel-2卫星图像,每条记录包含实例和语义分割掩码,并与多日期、多光谱图像配对。数据集的标注采用fiboa规范,确保了数据的标准化和互操作性。
特点
FTW数据集的一个显著特点是其广泛的地理覆盖和多样性,涵盖了24个国家的农业田地边界,远超以往的数据集。此外,FTW数据集的规模也大幅超越了现有的同类数据集,包含70,462个样本,覆盖总面积达166,293平方公里。数据集不仅在地理多样性上有所突破,还在田地形态、农业实践和气候模式上展现了极大的多样性,为机器学习模型提供了丰富的训练数据。
使用方法
FTW数据集适用于农业田地实例分割的机器学习任务,用户可以通过提供的多光谱Sentinel-2卫星图像和相应的分割掩码进行模型训练和评估。数据集提供了训练、验证和测试集,支持用户在不同国家尺度上进行评估。此外,数据集还提供了详细的元数据,用户可以根据需要轻松地对数据进行子集划分。FTW数据集的代码和预训练模型可通过GitHub和TorchGeo获取,方便用户进行进一步的研究和应用开发。
背景与挑战
背景概述
Fields of The World (FTW) 数据集由亚利桑那州立大学、微软AI for Good研究实验室等多个机构的研究人员共同创建,旨在解决全球农业领域中农田边界自动分割的挑战。该数据集涵盖了24个国家的农田数据,跨越欧洲、非洲、亚洲和南美洲四个大陆,包含70,462个样本,每个样本均包含实例分割和语义分割掩码,并配有多日期、多光谱的Sentinel-2卫星图像。FTW数据集的创建旨在推动机器学习方法在全球农业监测和评估中的应用,特别是在自动提取农田边界方面。通过提供大规模、多样化的农田数据,FTW数据集有望显著提升农田实例分割模型的地理覆盖范围、准确性和泛化能力,从而对农业监测、可持续农业和气候变化政策等领域产生深远影响。
当前挑战
FTW数据集在构建过程中面临多项挑战。首先,全球农田的多样性,包括不同地区的农田形态、农业实践和气候模式,增加了数据集的复杂性。其次,现有机器学习方法在农田实例分割上的地理覆盖范围有限,且缺乏足够的准确性和泛化能力。此外,数据集的构建需要整合来自不同国家和地区的农田边界数据,这些数据的获取和标准化处理均具有较高的难度。最后,如何确保模型在不同地理区域的零样本和微调性能,也是FTW数据集需要解决的重要问题。这些挑战不仅涉及技术层面的算法优化,还包括数据获取、处理和标准化等多个方面。
常用场景
经典使用场景
Fields of The World (FTW) 数据集的经典使用场景主要集中在农业监测和评估领域。该数据集通过提供全球24个国家的农业田地边界实例分割标注,结合多日期、多光谱的Sentinel-2卫星图像,为机器学习模型提供了丰富的训练数据。这些数据不仅支持田地边界的自动提取,还能用于作物类型分类、农业资源利用监测等应用。通过FTW数据集,研究人员能够开发和验证在全球范围内具有广泛适用性的田地边界分割模型。
衍生相关工作
FTW数据集的发布催生了一系列相关研究工作,特别是在田地边界分割和农业监测领域。例如,基于FTW数据集,研究人员开发了多种先进的机器学习模型,如U-Net和DeepLabv3+,用于提高田地边界分割的准确性和效率。此外,FTW数据集还促进了跨领域的研究,如结合遥感技术和地理信息系统(GIS),进行更精细化的农业资源管理和环境影响评估。未来,随着更多国家和地区的田地边界数据被纳入FTW,预计将会有更多创新性的研究成果涌现。
数据集最近研究
最新研究方向
近年来,Fields of The World (FTW) 数据集在农业领域的前沿研究中占据了重要地位。该数据集通过提供跨越24个国家、覆盖四大洲的农业田地实例分割数据,极大地推动了全球农业监测和评估的自动化进程。FTW数据集不仅在地理覆盖范围和样本数量上超越了以往的数据集,还通过多日期、多光谱的Sentinel-2卫星图像,显著提升了模型的零样本和微调性能。此外,FTW数据集的发布促进了农业田地边界分割研究的标准化和精细化评估,为全球农业监测、可持续农业发展以及气候变化政策制定提供了强有力的数据支持。
相关研究论文
  • 1
    亚利桑那州立大学等 · 2024年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

FER2013

FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。

github 收录

GME Data

关于2021年GameStop股票活动的数据,包括每日合并的GME短期成交量数据、每日失败交付数据、可借股数、期权链数据以及不同时间框架的开盘/最高/最低/收盘/成交量条形图。

github 收录

中国农村金融统计数据

该数据集包含了中国农村金融的统计信息,涵盖了农村金融机构的数量、贷款余额、存款余额、金融服务覆盖率等关键指标。数据按年度和地区分类,提供了详细的农村金融发展状况。

www.pbc.gov.cn 收录

THUCNews

THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。

github 收录

Breast Cancer Dataset

该项目专注于清理和转换一个乳腺癌数据集,该数据集最初由卢布尔雅那大学医学中心肿瘤研究所获得。目标是通过应用各种数据转换技术(如分类、编码和二值化)来创建一个可以由数据科学团队用于未来分析的精炼数据集。

github 收录