bespoke-manim|数学教育数据集|动画制作数据集

huggingface2025-02-27 更新2025-02-28 收录

数学教育

动画制作

下载链接：

https://huggingface.co/datasets/bespokelabs/bespoke-manim

下载链接

链接失效反馈

资源简介：

Bespoke-Manim是一个包含1000个数学动画视频脚本的完全合成数据集，部分条目还附有相应的Manim生成的动画。这个数据集是通过一个精心策划的管道使用Curator.LLM()和Curator.CodeExecutor()生成的，每个条目都包含一个数学问题、用于教育动画的详细脚本和生成动画所需的Manim代码。

创建时间：

2025-02-27

AI搜集汇总

数据集介绍

构建方式

Bespoke-Manim数据集的构建，采用了一种结构化的管道流程。首先进行科目与主题的选择，覆盖不同难度级别，并在每个主题下生成多个独特的问题，总计1000个问题。接着，为每个问题创建一个详细的脚本，用以指导数学动画视频的生成。最后，通过 Claude-Sonnet-3.7 与思考过程，为每个问题-脚本对生成相应的Manim代码。

特点

该数据集的特色在于其完全合成的特性，包含1000个数学动画视频脚本，部分条目还伴有相应的Manim生成动画。数据集的结构化字段丰富，包括数学问题、动画脚本、Manim代码、视觉元素描述、时间戳、关键时间点、视觉风格等，为数学教育动画的制作提供了全面的支持。

使用方法

使用Bespoke-Manim数据集，用户可以参照提供的文档和示例代码进行操作。例如，用户可以参考数学视频生成示例和Colab示例来开始使用。对于功能请求和错误报告，用户可以在GitHub上的Curator仓库提出问题。

背景与挑战

背景概述

Bespoke-Manim数据集是一项致力于数学教育领域的研究成果，由bespokelabsai机构采用先进的技术手段，于近年构建而成。该数据集涵盖了1000个数学问题的动画视频脚本，其中部分问题配有Manim生成的动画。它的创建，旨在为数学教育提供一种创新的辅助工具，通过详细的教育动画脚本和相应的Manim代码，促进数学概念的可视化教学，提高学习效率。数据集的特征字段设计细致，不仅包含题目和话题，还涵盖了脚本、视觉元素、关键时间戳等信息，为研究人员和教育工作者提供了丰富的资源。Bespoke-Manim数据集的构建，无疑是数学教育技术领域的一次重要尝试，对推动相关领域的研究与发展具有显著影响力。

当前挑战

尽管Bespoke-Manim数据集为数学教育带来了新的视角，但在实际应用中仍面临一些挑战。首先，数据集的构建过程中，如何保证动画脚本的教育价值和准确性是一个关键问题。其次，数据集的多样性和覆盖范围可能会限制其在不同教育层次和领域的应用。此外，Manim代码的生成和执行需要一定的技术支持，对于不熟悉相关技术的用户来说，可能存在一定的门槛。最后，数据集的质量控制和错误处理机制也是保证其可持续使用和扩展的重要挑战。

常用场景

经典使用场景

在数学教育领域，Bespoke-Manim数据集以其独特的数学动画视频脚本和相应的Manim生成动画，成为了教学辅助工具的经典应用。该数据集为教育工作者提供了丰富的教学素材，通过可视化的数学问题解析，增强了学生的学习体验。

解决学术问题

该数据集解决了传统数学教学中难以形象化复杂概念的问题，为学术研究提供了新的视角，使得抽象的数学概念能够通过动画形式直观展现，提高了数学知识传授的效率和效果。

衍生相关工作

基于Bespoke-Manim数据集，研究者们已经开展了一系列相关工作，如开发新的数学教育软件，设计更高效的教学方法，以及探索数学可视化在特殊教育中的应用潜力。

以上内容由AI搜集并总结生成

用户留言

有没有相关的论文或文献参考？

这个数据集是基于什么背景创建的？

数据集的作者是谁？

能帮我联系到这个数据集的作者吗？

这个数据集如何下载？

点击留言

数据主题

具身智能

数据集 4098个

机构 8个

大模型

数据集 439个

机构 10个

无人机

数据集 37个

机构 6个

指令微调

数据集 36个

机构 6个

蛋白质结构

数据集 50个

机构 8个

空间智能

数据集 21个

机构 5个

5,000+

优质数据集

54 个

任务类型

进入经典数据集

热门数据集

MOOCs Dataset

该数据集包含了大规模开放在线课程（MOOCs）的相关数据，包括课程信息、用户行为、学习进度等。数据主要用于研究在线教育的行为模式和学习效果。

www.kaggle.com 收录

LIDC-IDRI

LIDC-IDRI 数据集包含来自四位经验丰富的胸部放射科医师的病变注释。 LIDC-IDRI 包含来自 1010 名肺部患者的 1018 份低剂量肺部 CT。

OpenDataLab 收录

CliMedBench

CliMedBench是一个大规模的中文医疗大语言模型评估基准，由华东师范大学等机构创建。该数据集包含33,735个问题，涵盖14个核心临床场景，主要来源于顶级三级医院的真实电子健康记录和考试练习。数据集的创建过程包括专家指导的数据选择和多轮质量控制，确保数据的真实性和可靠性。CliMedBench旨在评估和提升医疗大语言模型在临床决策支持、诊断和治疗建议等方面的能力，解决医疗领域中模型性能评估的不足问题。

arXiv 收录

Plant-Diseases

Dataset for Plant Diseases containg variours Plant Disease

kaggle 收录

China Air Quality Historical Data

该数据集包含了中国多个城市的空气质量历史数据，涵盖了PM2.5、PM10、SO2、NO2、CO、O3等污染物浓度以及空气质量指数（AQI）等信息。数据按小时记录，提供了详细的空气质量监测数据。