five

Chemical Abstracts Service (CAS) Registry|化学物质数据集|数据库数据集

收藏
www.cas.org2024-10-25 收录
化学物质
数据库
下载链接:
https://www.cas.org/support/documentation/chemical-substances
下载链接
链接失效反馈
资源简介:
CAS Registry是一个包含超过1.8亿种化学物质信息的全球性数据库,包括有机和无机化合物、生物序列、合金、矿物、混合物、聚合物和盐。每种物质都有一个唯一的CAS注册号,用于标识和检索。
提供机构:
www.cas.org
AI搜集汇总
数据集介绍
main_image_url
构建方式
Chemical Abstracts Service (CAS) Registry数据集的构建基于美国化学文摘社(CAS)的广泛文献数据库,涵盖了自1907年以来的化学文献。该数据集通过自动化和人工审核相结合的方式,从全球范围内的科学出版物中提取化学物质信息。每种化学物质的信息包括其分子结构、化学名称、CAS登记号等关键数据,确保了数据的高质量和全面性。
特点
CAS Registry数据集以其全面性和权威性著称,包含了超过1.8亿种化学物质的信息,是全球化学领域最广泛使用的数据库之一。其特点在于数据的精确性和更新速度,能够及时反映化学领域的最新进展。此外,数据集中的每种化学物质都具有唯一的CAS登记号,便于全球范围内的检索和引用。
使用方法
CAS Registry数据集主要用于化学研究、药物开发、环境监测等多个领域。研究人员可以通过CAS登记号快速检索到特定化学物质的详细信息,从而支持其研究工作。此外,该数据集还支持高级搜索功能,允许用户根据分子结构、化学名称等条件进行精确查询。数据集的API接口也为开发者提供了便捷的数据访问方式,促进了化学信息技术的应用和发展。
背景与挑战
背景概述
化学文摘服务(Chemical Abstracts Service, CAS)注册表数据集,作为全球化学信息的核心资源,自1965年由美国化学学会(American Chemical Society, ACS)创建以来,便致力于收录和索引全球范围内的化学物质信息。该数据集不仅涵盖了数以亿计的有机和无机化合物,还包括生物分子、聚合物和合金等,为化学研究、药物开发和环境监测等领域提供了不可或缺的数据支持。CAS注册表的建立,极大地促进了化学信息的系统化管理,推动了跨学科研究的深入发展,成为全球科研人员和工业界的重要参考工具。
当前挑战
尽管CAS注册表在化学信息管理中占据重要地位,但其构建和维护过程中仍面临诸多挑战。首先,随着新化学物质的快速涌现,数据集的更新速度需与时俱进,以确保信息的时效性和准确性。其次,化学物质的多样性和复杂性,要求数据集具备高度的分类和索引能力,以应对不同结构和性质的化合物。此外,数据集的国际化特性,也带来了语言和文化差异的挑战,需确保多语言支持和文化适应性。最后,随着大数据和人工智能技术的发展,如何有效整合和分析海量化学数据,提升数据集的智能化水平,亦是当前亟待解决的问题。
发展历史
创建时间与更新
Chemical Abstracts Service (CAS) Registry数据集创建于1965年,由美国化学文摘社(CAS)开发。自创建以来,该数据集持续更新,以反映化学领域的最新进展。
重要里程碑
CAS Registry的重要里程碑包括1970年代初期的电子化转型,使得数据管理更加高效。1990年代,CAS推出了SciFinder,这是一个基于CAS Registry的化学信息检索系统,极大地提升了化学研究的可访问性和效率。进入21世纪,CAS Registry开始整合更多的生物化学和药物化学数据,进一步扩展了其应用范围。
当前发展情况
当前,CAS Registry已成为全球化学和相关科学领域的基础数据资源,涵盖了超过1.8亿种化学物质的信息。该数据集不仅支持基础研究,还在药物开发、环境监测和材料科学等多个应用领域发挥着关键作用。CAS Registry的持续更新和扩展,确保了其在全球科学研究中的核心地位,为跨学科的创新提供了坚实的数据基础。
发展历程
  • Chemical Abstracts Service (CAS) Registry首次发布,标志着化学信息管理进入了一个新的时代。
    1965年
  • CAS Registry开始广泛应用于学术研究和工业生产中,成为化学领域的重要参考工具。
    1970年
  • CAS Registry数据库的规模和覆盖范围显著扩大,收录了超过500万种化学物质。
    1980年
  • CAS Registry开始提供在线访问服务,极大地提高了数据的可访问性和利用率。
    1990年
  • CAS Registry数据库收录的化学物质数量突破2000万,成为全球最大的化学信息数据库之一。
    2000年
  • CAS Registry进一步优化其搜索和检索功能,引入先进的数据挖掘和分析工具,提升了用户体验。
    2010年
  • CAS Registry持续更新和扩展,目前收录的化学物质数量已超过1亿,继续引领化学信息管理的发展。
    2020年
常用场景
经典使用场景
在化学领域,Chemical Abstracts Service (CAS) Registry数据集被广泛用于化合物识别与分类。该数据集包含了全球范围内已知的化学物质的详细信息,包括分子结构、化学式、CAS登记号等。研究人员利用这些信息进行新化合物的合成设计、药物开发以及环境监测等研究。通过CAS Registry,科学家能够快速检索和验证化合物的身份,从而提高研究效率和准确性。
实际应用
在实际应用中,CAS Registry数据集被广泛应用于制药、化工、环保等行业。制药公司利用该数据集进行药物分子的筛选和优化,加速新药的研发进程。化工企业则通过CAS Registry进行原料和产品的合规性检查,确保生产安全。环保部门利用该数据集监测和评估化学物质的环境影响,制定相应的管理措施。CAS Registry的广泛应用极大地提升了各行业的效率和安全性。
衍生相关工作
CAS Registry数据集的丰富信息催生了众多相关研究和工作。例如,基于CAS Registry的化学信息学研究,开发了多种化合物数据库和检索工具,如SciFinder和STN。这些工具不仅提高了化学研究的效率,还推动了计算机辅助药物设计(CADD)的发展。此外,CAS Registry还为化学品的毒理学和环境风险评估提供了基础数据,促进了相关领域的科学进步。
以上内容由AI搜集并总结生成
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国交通事故深度调查(CIDAS)数据集

交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、

北方大数据交易中心 收录

MedChain

MedChain是由香港城市大学、香港中文大学、深圳大学、阳明交通大学和台北荣民总医院联合创建的临床决策数据集,包含12,163个临床案例,涵盖19个医学专科和156个子类别。数据集通过五个关键阶段模拟临床工作流程,强调个性化、互动性和顺序性。数据来源于中国医疗网站“iiYi”,经过专业医生验证和去识别化处理,确保数据质量和患者隐私。MedChain旨在评估大型语言模型在真实临床场景中的诊断能力,解决现有基准在个性化医疗、互动咨询和顺序决策方面的不足。

arXiv 收录

MedDialog

MedDialog数据集(中文)包含了医生和患者之间的对话(中文)。它有110万个对话和400万个话语。数据还在不断增长,会有更多的对话加入。原始对话来自好大夫网。

github 收录

Obstacle-dataset OD

该数据集用于十五种障碍物检测,包含VOC格式和YOLO训练的.txt文件,数据集中的图像来自VOC数据集、COCO数据集、TT100K数据集以及作者团队实地收集的图片。

github 收录

糖尿病预测数据集

糖尿病相关的医学研究或者健康数据

AI_Studio 收录