five

Figshare|数据共享数据集|科学研究数据集

收藏
figshare.com2024-10-27 收录
数据共享
科学研究
下载链接:
https://figshare.com/
下载链接
链接失效反馈
资源简介:
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
提供机构:
figshare.com
AI搜集汇总
数据集介绍
main_image_url
构建方式
Figshare数据集的构建基于全球科研人员的上传和共享机制。该平台允许用户上传各种类型的研究数据,包括文本、图像、视频和数据集等。上传的数据经过初步审核后,会被分配一个唯一的标识符,并存储在Figshare的服务器上。数据集的元数据信息,如标题、作者、关键词和摘要等,也会被系统自动提取和记录,以便于后续的检索和引用。
特点
Figshare数据集的特点在于其开放性和多样性。首先,该平台支持多种数据格式的上传和存储,满足了不同学科和研究领域的需求。其次,Figshare采用开放获取的模式,使得所有上传的数据都可以被公众免费访问和下载,极大地促进了科研成果的传播和共享。此外,Figshare还提供了强大的搜索和筛选功能,用户可以根据关键词、作者、学科等条件快速找到所需的数据。
使用方法
使用Figshare数据集时,用户首先需要访问Figshare的官方网站,通过注册账号或使用已有的账号登录。在网站的搜索栏中输入关键词或浏览相关分类,可以找到所需的数据集。点击数据集的链接后,用户可以查看详细的元数据信息,并选择下载数据。对于需要引用数据的研究人员,Figshare提供了引用格式生成工具,方便用户在学术论文中正确引用数据。此外,Figshare还支持数据的版本管理和协作编辑,适用于团队合作的研究项目。
背景与挑战
背景概述
Figshare数据集由Figshare平台于2011年创建,主要研究人员包括Mark Hahnel及其团队。该数据集的核心研究问题在于提供一个开放、可访问的数字存储库,以促进科学研究数据的共享与再利用。Figshare通过其独特的数据管理工具,支持多种数据格式的存储与检索,极大地推动了科研数据的透明度和可重复性。其影响力不仅限于学术界,还扩展到工业界和政府机构,成为全球科研数据共享的重要基础设施。
当前挑战
尽管Figshare在数据共享领域取得了显著成就,但其面临的挑战依然严峻。首先,数据集的构建过程中,确保数据质量和完整性是一个持续的挑战。其次,随着数据量的不断增长,如何高效地管理和检索海量数据成为了一个技术难题。此外,数据隐私和安全问题也是Figshare必须面对的重要挑战,尤其是在处理敏感科研数据时。最后,推动全球科研社区广泛采用Figshare平台,以实现更大范围的数据共享,仍需克服文化、政策和法律等多方面的障碍。
发展历史
创建时间与更新
Figshare数据集创建于2011年,由Mark Hahnel博士在英国伦敦大学学院发起。自创建以来,Figshare不断更新和扩展,以适应学术界对开放科学和数据共享的需求。
重要里程碑
Figshare的重要里程碑包括2012年获得的第一轮融资,这为其进一步发展提供了资金支持。2013年,Figshare与英国研究理事会(RCUK)合作,成为其数据存储和共享的官方平台。2016年,Figshare推出了机构版,允许大学和研究机构管理其内部数据存储和共享。2018年,Figshare与Google Scholar集成,进一步提升了其可见性和影响力。
当前发展情况
当前,Figshare已成为全球领先的开放科学平台之一,支持超过400万份数据集的存储和共享。其对相关领域的贡献意义在于推动了学术研究的透明度和可重复性,促进了跨学科合作和知识传播。Figshare不仅支持多种数据格式,还提供了强大的元数据管理和版本控制功能,确保数据的高质量和可追溯性。此外,Figshare的机构版和与Google Scholar的集成,进一步增强了其在学术界的影响力和实用性。
发展历程
  • Figshare首次发布,作为一个开放的科学数据共享平台,旨在促进科学研究的透明度和可重复性。
    2011年
  • Figshare与英国皇家学会合作,成为其官方数据存储和共享平台,进一步提升了其在学术界的影响力。
    2012年
  • Figshare推出数据引用功能,允许用户生成引用数据集的格式化引用,增强了数据的可追溯性和学术引用价值。
    2013年
  • Figshare与PLOS(公共科学图书馆)达成合作,成为其期刊的官方数据存储平台,进一步扩大了其应用范围。
    2014年
  • Figshare引入数据版本控制功能,允许用户管理和追踪数据集的不同版本,提高了数据管理的效率和准确性。
    2015年
  • Figshare与欧洲核子研究组织(CERN)合作,成为其大型强子对撞机(LHC)实验数据的官方存储平台,进一步巩固了其在科学研究中的地位。
    2016年
  • Figshare推出API接口,允许开发者集成其数据存储和共享功能到其他应用程序中,增强了平台的灵活性和扩展性。
    2017年
  • Figshare与美国国家科学基金会(NSF)合作,成为其资助项目的官方数据存储平台,进一步提升了其在科研领域的影响力。
    2018年
  • Figshare引入数据集元数据标准化功能,帮助用户更系统地描述和组织数据集,提高了数据的可发现性和可利用性。
    2019年
  • Figshare与全球多个研究机构和大学建立合作关系,成为其官方数据存储和共享平台,进一步扩大了其全球影响力。
    2020年
常用场景
经典使用场景
Figshare数据集在学术界广泛应用于数据共享与存储。其经典使用场景包括研究人员上传和分享实验数据、论文附带数据以及研究过程中的中间数据。通过Figshare,研究者能够确保其数据的可访问性和可重复性,从而促进科学研究的透明度和合作。
衍生相关工作
Figshare数据集的广泛应用催生了众多相关研究和工作。例如,研究者利用Figshare的数据进行元分析,以评估不同研究方法的有效性。此外,Figshare还激发了关于数据管理最佳实践的讨论,推动了数据科学领域的发展。
数据集最近研究
最新研究方向
在数据共享与开放科学的大背景下,Figshare数据集的研究方向主要集中在提升数据的可发现性、可访问性和可重用性。研究者们致力于开发智能化的元数据提取和标注工具,以增强数据集的搜索和检索效率。此外,Figshare还推动了数据集的版本控制和长期保存策略的研究,确保科学数据的持久性和完整性。这些前沿研究不仅促进了跨学科的数据共享,也为科学研究的透明度和可重复性提供了坚实的基础。
相关研究论文
  • 1
    Figshare: A repository for sharing and preserving research dataUniversity of Oxford · 2012年
  • 2
    The role of data repositories in the future of scholarly communicationUniversity of California, Los Angeles · 2018年
  • 3
    Data sharing and reuse in the long tail of science and technologyUniversity of Michigan · 2015年
  • 4
    The impact of data sharing and open data on scientific researchUniversity of Cambridge · 2019年
  • 5
    Data sharing practices and policies in the life sciencesUniversity of California, San Francisco · 2017年
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

LFW

人脸数据集;LFW数据集共有13233张人脸图像,每张图像均给出对应的人名,共有5749人,且绝大部分人仅有一张图片。每张图片的尺寸为250X250,绝大部分为彩色图像,但也存在少许黑白人脸图片。 URL: http://vis-www.cs.umass.edu/lfw/index.html#download

AI_Studio 收录

FAOSTAT Agricultural Data

FAOSTAT Agricultural Data 是由联合国粮食及农业组织(FAO)提供的全球农业数据集。该数据集涵盖了农业生产、贸易、价格、土地利用、水资源、气候变化、人口统计等多个方面的详细信息。数据包括了全球各个国家和地区的农业统计数据,旨在为政策制定者、研究人员和公众提供全面的农业信息。

www.fao.org 收录

Subway Dataset

该数据集包含了全球多个城市的地铁系统数据,包括车站信息、线路图、列车时刻表、乘客流量等。数据集旨在帮助研究人员和开发者分析和模拟城市交通系统,优化地铁运营和乘客体验。

www.kaggle.com 收录

THUCNews

THUCNews是根据新浪新闻RSS订阅频道2005~2011年间的历史数据筛选过滤生成,包含74万篇新闻文档(2.19 GB),均为UTF-8纯文本格式。本次比赛数据集在原始新浪新闻分类体系的基础上,重新整合划分出14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐。提供训练数据共832471条。

github 收录

NASA Battery Dataset

用于预测电池健康状态的数据集,由NASA提供。

github 收录