five

OpenUAV|无人机导航数据集|视觉语言处理数据集

收藏
arXiv2024-10-10 更新2024-10-11 收录
无人机导航
视觉语言处理
下载链接:
https://prince687028.github.io/OpenUAV
下载链接
链接失效反馈
资源简介:
OpenUAV数据集是由北京航空航天大学人工智能研究所创建的,专门用于无人机视觉语言导航任务。该数据集包含约12,000条轨迹,涵盖了6自由度的飞行动态,准确捕捉了无人机的复杂飞行行为。数据集的创建过程包括在OpenUAV平台上进行连续飞行,并使用GPT-4生成目标描述,随后进行人工质量检查。该数据集主要应用于无人机在复杂环境中的导航任务,旨在提高无人机在现实世界中的导航精度和效率。
提供机构:
北京航空航天大学人工智能研究所
创建时间:
2024-10-10
AI搜集汇总
数据集介绍
main_image_url
构建方式
OpenUAV数据集的构建基于一个高度仿真的无人机视觉语言导航(VLN)平台,该平台集成了多样化的环境、真实的飞行控制和广泛的算法支持。通过在OpenUAV平台上进行约12,000次轨迹的收集,构建了一个面向目标的VLN数据集。这些轨迹由人类标注者在平台上进行连续飞行,定期记录无人机状态,并异步收集传感器数据,以获取导航轨迹。利用GPT-4生成目标描述,并进行人工质量检查,最终形成了高质量的导航指令,共计约12,000对轨迹-指令对。
特点
OpenUAV数据集的显著特点在于其真实性和复杂性。该数据集首次包含了6自由度(DoF)的运动轨迹,准确捕捉了无人机的复杂飞行动力学。此外,数据集中的环境多样且复杂,涵盖了城市、乡村和自然景观等多种场景,确保了任务的挑战性和复杂性。数据集还提供了详细的导航指令和环境信息,增强了无人机的导航能力。
使用方法
OpenUAV数据集适用于研究无人机视觉语言导航(VLN)任务,特别是在复杂和真实环境中的应用。研究者可以利用该数据集训练和评估无人机导航模型,探索如何在多模态信息(如视觉和文本)的指导下实现精确导航。数据集的多样性和真实性使其成为开发和验证新型导航算法的重要资源,有助于推动无人机VLN系统向实际应用的转化。
背景与挑战
背景概述
视觉-语言导航(VLN)作为人工智能领域的一个长期目标,旨在构建能够理解人类指令并据此导航的具身代理。近年来,VLN研究主要集中在地面代理上,而基于无人机的VLN(UAV-VLN)则相对较少受到关注。尽管UAV-VLN具有丰富的应用场景,但由于无人机与地面代理在动作空间和观察上的显著差异,这一领域仍具有巨大的研究价值。OpenUAV数据集由北京航空航天大学和香港中文大学的研究人员于2024年创建,旨在解决无人机在复杂空中环境中进行视觉-语言导航的挑战。该数据集通过引入真实飞行控制和多样化算法支持,构建了首个专门为无人机VLN任务设计的目标导向VLN数据集,包含约12,000条轨迹,为无人机在真实环境中的导航提供了重要资源。
当前挑战
OpenUAV数据集面临的挑战主要集中在两个方面:一是无人机运动动力学的不匹配,无人机在三维空间中的自由运动使其轨迹难以分解为离散动作,传统的固定动作集方法无法捕捉真实的飞行动力学;二是导航任务的复杂性,无人机在多样化的户外开放环境中操作,导航路径通常较长且复杂,仅依赖目标描述不足以在复杂动态场景中进行精确的定位和导航。此外,数据集构建过程中遇到的挑战包括如何收集高质量的导航指令和真实飞行轨迹,以及如何处理传感器数据以确保数据的连续性和准确性。这些挑战共同构成了OpenUAV数据集在推动无人机视觉-语言导航研究中的关键障碍。
常用场景
经典使用场景
OpenUAV数据集在无人机视觉语言导航(VLN)任务中展现了其经典应用场景。该数据集通过模拟真实环境中的飞行控制和多样化的算法支持,为无人机在复杂环境中的导航提供了丰富的训练数据。其核心应用在于通过语言指令和视觉信息引导无人机到达目标位置,特别是在需要连续轨迹生成和复杂场景理解的情境下,OpenUAV数据集为研究者提供了一个高度仿真的实验平台。
衍生相关工作
OpenUAV数据集的发布催生了一系列相关研究工作。研究者们基于该数据集开发了多种无人机导航模型,如结合多模态理解能力的LLM模型,显著提升了无人机在复杂环境中的导航性能。此外,OpenUAV平台还激发了对无人机自主导航能力的深入研究,推动了从模拟环境到真实世界部署的技术转移。这些衍生工作不仅扩展了无人机VLN的研究边界,也为无人机技术的广泛应用奠定了基础。
数据集最近研究
最新研究方向
在无人机视觉语言导航(VLN)领域,OpenUAV数据集的最新研究方向主要集中在实现更真实的无人机导航任务。研究者们通过构建OpenUAV平台,结合多样化的环境、真实的飞行控制和广泛的算法支持,推动了无人机VLN任务的现实模拟。此外,研究还引入了UAV-Need-Help基准,通过提供不同级别的辅助信息,帮助无人机在复杂环境中完成目标导向的VLN任务。这些研究不仅提升了无人机在复杂环境中的导航能力,还为将VLN系统应用于实际场景奠定了基础。
相关研究论文
  • 1
    Towards Realistic UAV Vision-Language Navigation: Platform, Benchmark, and Methodology北京航空航天大学人工智能研究所 · 2024年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4099个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

鸭绿江流域与水系 – 世界地理数据大百科辞条

鸭绿江流域是指鸭绿江干流和支流汇水区,地理位置为39&deg43′57″N-42&deg17′28″N,123&deg35′59″E-128&deg45′50″E。与其接壤的流域分别是辽河流域(东)、松花江流域(北)、图们江流域(北)、大同江流域(西南)等。鸭绿江流域界线在中国境内从长白山天池火山口的南壁起始,向西南经长白山脉、转向西南至千山山脉的北部,再折向南入海;在朝鲜境内,鸭绿江流域从长白山天池南坡启始向东南经过摩天岭山脉,在头流山(2309 m)转向西南方向的赴战岭山脉,在英雄里附近转向西,经狼林山(2184 m)、广城、松源,转向西南方向的狄逾岭山脉,接江南山脉的南部后至鸭绿江河口。鸭绿江流域面积65215.49 km&sup2,其中,中国境内面积32799.22 km&sup2,朝鲜境内面积32416.27 km&sup2。鸭绿江是中(国)朝(鲜)界河,它起源于长白山天池火山口的南壁,向南经惠山(朝)、折向西经临江(中)、再转向西南直向丹东(中)、新义州(朝),最后在东港(中)和多狮里(朝)附近注入黄海的西朝鲜湾。鸭绿江干流长844.98 km,有几条比较大的支流汇入,包括在朝鲜境内的虛川江、長津江、厚州川、慈城江、禿魯江、忠满江和三桥川;在中国境内的浑江、蒲石河、瑗河等。鸭绿江干流沿中朝国界线自东北向西南流经吉林省的长白朝鲜族自治县、临江市、集安市;辽宁省的桓仁满族自治县、宽甸满族自治县、丹东市和东港市;朝鲜的两江道、慈江道和平安北道。鸭绿江流域地处暖温带湿润季风气候区。年降水量800-1200 mm。流域内多山,最高海拔2745 m,河道比降比较大,达到0.0032,其中在中段可达到0.01。丰富的降水补给和较大的河床比降,使得鸭绿江流域成为亚洲单位面积水资源和水利资源最丰富的流域之一。近80年来,流域内先后建造了水丰水库(中、朝)、渭源水库(中、朝)、铁甲水库(中)、太平哨水库(中)、桓仁水库(中)、回龙山水库(中)、满丰湖水库(朝)、版平里水库(朝)、时中湖水库(朝)、狼林湖水库(朝)、长津湖水库(朝)、赴战湖水库(朝)、丰西湖水库等(朝)。数据文件包括鸭绿江干流、鸭绿江水系和鸭绿江流域地理信息系统数据文件组成。数据集以.kmz 和.shp格式存储,数据量43.8 MB(压缩为20.1 MB)。

国家对地观测科学数据中心 收录

China Health and Nutrition Survey (CHNS)

China Health and Nutrition Survey(CHNS)是一项由美国北卡罗来纳大学人口中心与中国疾病预防控制中心营养与健康所合作开展的长期开放性队列研究项目,旨在评估国家和地方政府的健康、营养与家庭计划政策对人群健康和营养状况的影响,以及社会经济转型对居民健康行为和健康结果的作用。该调查覆盖中国15个省份和直辖市的约7200户家庭、超过30000名个体,采用多阶段随机抽样方法,收集了家庭、个体以及社区层面的详细数据,包括饮食、健康、经济和社会因素等信息。自2011年起,CHNS不断扩展,新增多个城市和省份,并持续完善纵向数据链接,为研究中国社会经济变化与健康营养的动态关系提供了重要的数据支持。

www.cpc.unc.edu 收录

IVLLab/MultiDialog

该数据集包含手动注释的元数据,将音频文件与转录、情感和其他属性链接起来。数据集支持多种任务,包括多模态对话生成、自动语音识别和文本到语音转换。数据集的语言为英语,并提供了一个黄金情感对话子集,用于研究对话中的情感动态。数据集的结构包括音频文件、对话ID、话语ID、来源、音频特征、转录文本、情感标签和原始路径等信息。

hugging_face 收录

The sex [Male (1) and female (2)] age (in years), weight (in lbs), #GPS Points (total after filtering), and the 100% MCP, 95% KDE, and 50% KDE home ranges (ha) for all cats sampled in the study. All cats were desexed. The personality scores (shown as a percent), were obtained from a survey, based on the “Feline Five” (Litchfield et al., 2017), that evaluated how much owners agreed or disagreed that their cats showed certain traits. Traits were then summed and converted into percentages. Bold cats are considered to have a low neuroticism score. Road density was estimated by summing the road lengths, measured in meters, within a fixed boundary centred on each cat’s mean latitude and longitude coordinates. The variable “major road” indicated the presence (1) or absence (0) of a major road near the cat’s home range. Roads were labeled as “major” based on Google Maps’ classification, related to traffic rates, and through “ground-truthing”.

Domestic cats (<i>Felis catus</i>) play a dual role in society as both companion animals and predators. When provided with unsupervised outdoor access, cats can negatively impact native wildlife and create public health and animal welfare challenges. The effective implementation of management strategies, such as buffer zones or curfews, requires an understanding of home range size, the factors that influence their movement, and the types of habitats they use. Here, we used a community/citizen scientist approach to collect movement and habitat use data using GPS collars on owned outdoor cats in the Kitchener-Waterloo-Cambridge-Guelph region, southwestern Ontario, Canada.

DataCite Commons 收录

LIDC-IDRI

LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。

OpenDataLab 收录