ChickenLanguageDataset|家禽声音分析数据集|机器学习数据集
收藏数据集概述
数据集名称
ChickenLanguageDataset
数据集目的
用于创建机器学习模型,实现鸡到人类语言的翻译,并更好地理解家禽的需求。
数据类型
- 单只鸡的单一发声,用于“翻译”成人类语言。
- 包含多只鸡的长音频片段,用于评估鸡的整体健康状况。
当前研究的发声类型
- 问候
- “我需要下蛋,但有人在我的巢箱里!”
- “请给我一些隐私 - 我在下蛋。”
- “我下了蛋!”
- “大家在哪里?”
- 地面捕食者警告
- 空中捕食者警告
- 大声不满的叫声
- 母鸡让小鸡跟随她的声音
- 母鸡对小鸡的tidbitting声
- 公鸡对母鸡的tidbitting声
- “哎哟”或“停下”
- 吃食时的快乐声音
- 洗澡时的快乐声音
- 未知 - 未曾听过的独特发声
贡献指南
- 提交数据为wav文件,根据发声类型放入相应文件夹。
- 文件命名应精确反映鸡的发声意图。
- 如有同名文件,添加唯一数字标识符。
- 鼓励包含时间、天气、鸡的品种等元数据。
文件命名示例
- Greeting: primarycaretaker-.wav, stranger.wav
- nest_box_needed.wav
- privacy_please.wav
- egg_song1.wav
- where_is_everybody.wav
- golden_retreiver.wav, eagle.wav
- hungry.wav, thirsty.wav, 90Fheat.wav
- hen_telling_chicks_to_follow_her.wav
- tidbitting_hen.wav, tidbitting_rooster.wav
- ouch.wav
- eating.wav
- dust_bath.wav
- "chicken_looking_for_me_through_window.wav"

ROBEL
ROBEL是一个开源的低成本机器人平台,专为现实世界的强化学习设计。该平台由谷歌研究院和加州大学伯克利分校共同开发,包含两个机器人:D'Claw,一个三指手机器人,用于促进精细操作任务的学习;D'Kitty,一个四足机器人,用于促进敏捷的腿式移动任务学习。这些模块化机器人易于维护且足够坚固,能够承受从零开始的硬件强化学习,目前已记录超过14000小时的训练时间。ROBEL提供了一系列连续控制基准任务,这些任务具有密集和稀疏的任务目标,并引入了硬件安全评分指标。数据集和相关材料可在www.roboticsbenchmarks.org访问,旨在解决强化学习在真实机器人上的应用问题,特别是在处理物理限制和环境交互方面的挑战。
arXiv 收录
中国1km分辨率逐月降水量数据集(1901-2023)
该数据集为中国逐月降水量数据,空间分辨率为0.0083333°(约1km),时间为1901.1-2023.12。数据格式为NETCDF,即.nc格式。该数据集是根据CRU发布的全球0.5°气候数据集以及WorldClim发布的全球高分辨率气候数据集,通过Delta空间降尺度方案在中国降尺度生成的。并且,使用496个独立气象观测点数据进行验证,验证结果可信。本数据集包含的地理空间范围是全国主要陆地(包含港澳台地区),不含南海岛礁等区域。为了便于存储,数据均为int16型存于nc文件中,降水单位为0.1mm。 nc数据可使用ArcMAP软件打开制图; 并可用Matlab软件进行提取处理,Matlab发布了读入与存储nc文件的函数,读取函数为ncread,切换到nc文件存储文件夹,语句表达为:ncread (‘XXX.nc’,‘var’, [i j t],[leni lenj lent]),其中XXX.nc为文件名,为字符串需要’’;var是从XXX.nc中读取的变量名,为字符串需要’’;i、j、t分别为读取数据的起始行、列、时间,leni、lenj、lent i分别为在行、列、时间维度上读取的长度。这样,研究区内任何地区、任何时间段均可用此函数读取。Matlab的help里面有很多关于nc数据的命令,可查看。数据坐标系统建议使用WGS84。
国家青藏高原科学数据中心 收录
FER2013
FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。
github 收录
Large and Multi-modality Satellite Datasets
随着遥感数据的不断丰富和大模型技术的快速发展,大量用于预训练和图像生成等任务的大规模遥感数据集相继发布。为了便于更好地理解和利用这些数据集,我们整理并总结了目前可用的资源,特别关注全球分布和多模态数据集。
github 收录
用于陆面模拟的中国土壤数据集(第二版)
本研究对中国范围内0-2米六个标准深度层(0-5、5-15、15-30、30-60、60-100和100-200厘米)的23种土壤物理和化学属性进行了90米空间分辨率的制图。该数据集源自第二次土壤普查的8979个土壤剖面,世界土壤信息服务的1540个土壤剖面,第一次全国土壤普查的76个土壤剖面,以及区域数据库的614个土壤剖面。该数据集包括pH值、砂粒、粉粒、粘粒、容重、有机碳含量、砾石、碱解氮、总氮、阳离子交换量、孔隙度、总钾、总磷、有效钾、有效磷和土壤颜色(包括蒙赛尔颜色和RGB两种形式)。数据集的缺失值为“fillvalue = -32768”。数据集以栅格格式提供,有Tiff和netCDF两种格式。为了满足陆面建模中不同应用对空间分辨率的不同要求,CSDLv2 提供了 90 米、1 公里和 10公里空间分辨率的版本。各个土壤属性的单位参见说明文档。该数据集相对于第一版具有更好的数据质量,可广泛应用于陆面过程模拟等地学相关研究。
国家青藏高原科学数据中心 收录