全国医院名录|医疗资源数据集|医院信息数据集
收藏LibriSpeech
LibriSpeech 是一个大约 1000 小时的 16kHz 英语朗读语音语料库,由 Vassil Panayotov 在 Daniel Povey 的协助下编写。数据来自 LibriVox 项目的已读有声读物,并经过仔细分割和对齐。
OpenDataLab 收录
MedDialog
MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。
github 收录
ElecBench
ElecBench是一个专为电力系统操作中的大型语言模型(LLM)评估而设计的数据集。该数据集旨在通过覆盖特定行业的场景和深化专业知识的测试,提高决策的精确性。数据集包括六个核心性能指标和24个子指标,用于评估LLM在电力系统操作中的应用能力。ElecBench的创建旨在解决现有评估基准的不足,特别是在处理电力系统操作中的复杂专业问题和高级技术知识方面。该数据集的应用领域主要集中在电力系统的优化、稳定性和经济效率的提升。
arXiv 收录
China Air Quality Historical Data
该数据集包含了中国多个城市的空气质量历史数据,涵盖了PM2.5、PM10、SO2、NO2、CO、O3等污染物浓度以及空气质量指数(AQI)等信息。数据按小时记录,提供了详细的空气质量监测数据。
www.cnemc.cn 收录
RML24
RML24是首个专门为卫星信号识别和解调的深度学习应用设计的数据集。它整合了遥测和通信信号在遥测、跟踪和指挥(TT&C)系统中,并模拟了真实卫星信道中的信号损伤效应。该数据集利用软件定义无线电(SDR)平台和射频(RF)收发器进行严格的空中测量,并验证收集的数据。RML24为研究人员提供了基本的数据和建模基准,以促进智能和自适应卫星通信系统的算法验证和发展,推动数据驱动卫星通信技术的发展。
github 收录