Global Biodiversity Information Facility (GBIF) - Insects|昆虫多样性数据集|生物信息数据集
收藏
- Global Biodiversity Information Facility (GBIF) 正式成立,旨在促进全球生物多样性数据的共享与利用。
- GBIF 首次发布关于昆虫的数据集,标志着昆虫多样性数据在全球范围内的系统性整合与公开。
- GBIF 的昆虫数据集开始广泛应用于生态学、保护生物学和环境科学等领域,成为研究昆虫多样性和生态系统功能的重要资源。
- GBIF 的昆虫数据集达到新的里程碑,收录的昆虫物种记录超过10亿条,极大地丰富了全球生物多样性数据库。
- GBIF 继续扩展其昆虫数据集,引入更多高质量的数据源,并加强与其他国际生物多样性数据平台的合作,推动全球昆虫多样性研究的发展。
学生课堂行为数据集 (SCB-dataset3)
学生课堂行为数据集(SCB-dataset3)由成都东软学院创建,包含5686张图像和45578个标签,重点关注六种行为:举手、阅读、写作、使用手机、低头和趴桌。数据集覆盖从幼儿园到大学的不同场景,通过YOLOv5、YOLOv7和YOLOv8算法评估,平均精度达到80.3%。该数据集旨在为学生行为检测研究提供坚实基础,解决教育领域中学生行为数据集的缺乏问题。
arXiv 收录
MedChain
MedChain是由香港城市大学、香港中文大学、深圳大学、阳明交通大学和台北荣民总医院联合创建的临床决策数据集,包含12,163个临床案例,涵盖19个医学专科和156个子类别。数据集通过五个关键阶段模拟临床工作流程,强调个性化、互动性和顺序性。数据来源于中国医疗网站“iiYi”,经过专业医生验证和去识别化处理,确保数据质量和患者隐私。MedChain旨在评估大型语言模型在真实临床场景中的诊断能力,解决现有基准在个性化医疗、互动咨询和顺序决策方面的不足。
arXiv 收录
LibriSpeech
LibriSpeech 是一个大约 1000 小时的 16kHz 英语朗读语音语料库,由 Vassil Panayotov 在 Daniel Povey 的协助下编写。数据来自 LibriVox 项目的已读有声读物,并经过仔细分割和对齐。
OpenDataLab 收录
FER2013
FER2013数据集是一个广泛用于面部表情识别领域的数据集,包含28,709个训练样本和7,178个测试样本。图像属性为48x48像素,标签包括愤怒、厌恶、恐惧、快乐、悲伤、惊讶和中性。
github 收录
Obstacle-dataset OD
该数据集用于十五种障碍物检测,包含VOC格式和YOLO训练的.txt文件,数据集中的图像来自VOC数据集、COCO数据集、TT100K数据集以及作者团队实地收集的图片。
github 收录