five

MedOdyssey|医疗数据数据集|人工智能数据集

收藏
arXiv2024-06-21 更新2024-06-25 收录
医疗数据
人工智能
下载链接:
https://github.com/JOHNNY-fans/MedOdyssey
下载链接
链接失效反馈
资源简介:
MedOdyssey是由华东理工大学和上海人工智能实验室联合创建的医疗领域长上下文评估基准,包含10个复杂数据集,涉及医疗专业语料库,如医疗书籍、指南、病例和知识图谱等。数据集通过收集开放源和版权自由的医疗数据构建,旨在评估大型语言模型在处理长上下文时的性能,特别是在医疗领域的应用,如电子健康记录分析和生物医学术语标准化。
提供机构:
华东理工大学信息科学与工程学院,上海,中国
创建时间:
2024-06-21
AI搜集汇总
数据集介绍
main_image_url
构建方式
MedOdyssey数据集的构建基于七个不同长度的文本级别,从4K到200K tokens,涵盖了医疗领域的长文本评估需求。该数据集由两个主要部分组成:医疗上下文中的‘大海捞针’任务和一系列医疗相关的任务,共计10个数据集。构建过程中,采用了自动化和人工协作的方式,确保数据集的公平性和专业性,同时通过引入‘最大相同上下文’原则,确保不同模型在评估时面对尽可能相同的上下文,以提高评估的公平性。
特点
MedOdyssey数据集的显著特点在于其针对医疗领域长文本处理的独特设计。数据集包含了医疗上下文中的‘大海捞针’任务,通过插入无关知识片段并要求模型识别,测试模型的长文本处理能力。此外,数据集还包括一系列医疗相关的任务,如医学术语标准化、知识图谱问答等,这些任务不仅要求模型具备长文本处理能力,还需具备专业的医疗知识。
使用方法
MedOdyssey数据集适用于评估和提升大型语言模型在医疗领域长文本处理的能力。使用该数据集时,研究者可以通过对比不同模型在各个任务上的表现,分析模型在长文本处理和专业医疗知识应用上的优劣。此外,数据集的构建原则和方法也可为其他领域的长文本评估提供参考,推动长文本处理技术的发展。
背景与挑战
背景概述
MedOdyssey数据集由华东理工大学信息科学与工程学院、上海人工智能实验室智能医疗团队以及上海交通大学电子信息与电气工程学院的研究人员共同创建,旨在评估大型语言模型(LLMs)在医疗领域长上下文环境中的表现。该数据集于2024年提出,是首个针对医疗领域长上下文能力的基准测试,涵盖了从4K到200K标记的七个长度级别。MedOdyssey的核心研究问题是如何在医疗专业知识的背景下,评估和提升LLMs处理长文本的能力,这对于医疗领域的任务如生物医学术语标准化和电子健康记录分析至关重要。该数据集的提出填补了医疗领域长上下文评估的空白,为相关领域的研究提供了新的工具和方法。
当前挑战
MedOdyssey数据集面临的挑战主要包括两个方面:一是解决医疗领域长上下文处理的独特问题,如反直觉推理和未知事实注入,以防止知识泄露和数据污染;二是构建过程中遇到的实际困难,如数据收集的版权和隐私保护问题。此外,确保不同LLMs在评估中观察到尽可能相同的上下文,以提高公平性,也是一个重要的挑战。这些挑战不仅影响了数据集的构建质量,也对其在实际应用中的有效性提出了考验。
常用场景
经典使用场景
MedOdyssey数据集在医学领域中被广泛用于评估大型语言模型(LLMs)在长上下文环境下的表现。其经典使用场景包括医学文本中的‘大海捞针’任务,即在长篇医学文本中识别特定信息片段,以及一系列医学相关的任务,如医学术语标准化、知识图谱问答和电子健康记录分析。这些任务旨在测试LLMs在处理复杂医学文本时的准确性和效率。
衍生相关工作
MedOdyssey数据集的发布催生了一系列相关的经典工作,包括对不同LLMs在医学长上下文任务中的性能比较研究,以及针对医学文本特点的模型优化方法。例如,一些研究通过引入新的位置编码技术和高效的Transformer架构,扩展了LLMs的上下文窗口,使其能够更好地处理长篇医学文本。此外,还有研究探讨了如何通过数据增强和知识注入等方法,提高模型在医学领域的推理和理解能力。
数据集最近研究
最新研究方向
在医疗领域,长上下文处理能力对于大型语言模型(LLMs)的应用至关重要。MedOdyssey数据集的最新研究方向聚焦于评估LLMs在处理长达200K标记的医疗文本时的表现。该研究不仅涵盖了医疗领域的长上下文评估,还引入了‘最大相同上下文’原则,以确保不同模型在评估中面对相同的上下文,从而提升评估的公平性。此外,研究还通过‘新颖事实注入’和‘反直觉推理’等方法,有效防止了模型在训练数据中已见过的问题,进一步提升了评估的可靠性和挑战性。这些研究成果为医疗领域的LLMs应用提供了重要的基准和方向,揭示了当前模型在处理复杂医疗文本时的局限性,并为未来的改进提供了明确的路径。
相关研究论文
  • 1
    MedOdyssey: A Medical Domain Benchmark for Long Context Evaluation Up to 200K Tokens华东理工大学信息科学与工程学院,上海,中国 · 2024年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

MedChain

MedChain是由香港城市大学、香港中文大学、深圳大学、阳明交通大学和台北荣民总医院联合创建的临床决策数据集,包含12,163个临床案例,涵盖19个医学专科和156个子类别。数据集通过五个关键阶段模拟临床工作流程,强调个性化、互动性和顺序性。数据来源于中国医疗网站“iiYi”,经过专业医生验证和去识别化处理,确保数据质量和患者隐私。MedChain旨在评估大型语言模型在真实临床场景中的诊断能力,解决现有基准在个性化医疗、互动咨询和顺序决策方面的不足。

arXiv 收录

YOLO Drone Detection Dataset

为了促进无人机检测模型的开发和评估,我们引入了一个新颖且全面的数据集,专门为训练和测试无人机检测算法而设计。该数据集来源于Kaggle上的公开数据集,包含在各种环境和摄像机视角下捕获的多样化的带注释图像。数据集包括无人机实例以及其他常见对象,以实现强大的检测和分类。

github 收录

中国省级灾害统计空间分布数据集(1999-2020年)

该数据集为中国省级灾害统计空间分布数据集,时间为1999-2020年。该数据集包含中国各省自然灾害、地质灾害、地震灾害、森林火灾、森林病虫鼠害、草原灾害六类灾害的详细数据。数据量为206MB,数据格式为excel。

国家地球系统科学数据中心 收录

安星云平台

安星平台是一个功能强大的工具,用于管理消防技术服务公司或个人的日常工作流程,提高工作效率。该平台支持多种任务类型,包括消防维保、消防检测和消防评估等,能够满足不同用户的需求。在安星平台上,用户可以快速创建任务、分配任务、跟踪任务进展并生成报告,从而使得整个工作流程更加高效和透明。此外,安星还集成了多种智能功能,如自动提醒、智能报表和数据分析等,帮助用户更好地掌握工作进展和趋势,从而做出更明智的决策。

苏州大数据交易所 收录

MedDialog

MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。

github 收录