public_long_form_thought_data_5k|慢思考推理数据集|认知科学数据集
收藏STILL: Slow Thinking with LLMs
数据集
- 训练数据: 部分训练数据已开源,文件名为
public_long_form_thought_data_5k.jsonl
,位于data/
目录下。
模型
- 模型: 已开源模型
STILL-2
,可在 Hugging Face 上获取。
技术报告
-
Imitate, Explore, and Self-Improve: A Reproduction Report on Slow-thinking Reasoning Systems:
- 报告地址: arXiv:2412.09413
- 内容概述: 介绍了实现类似 o1 的慢思考推理系统的复现报告,采用模仿、探索和自我改进的框架进行模型训练。
-
Enhancing LLM Reasoning with Reward-guided Tree Search:
- 报告地址: arXiv:2411.11694
- 内容概述: 探讨了通过奖励引导的树搜索算法增强 LLM 推理能力的方法。
未来工作
- 计划研究如何扩展训练方法的容量,以应对更复杂的任务。
引用
-
如果技术报告对研究有帮助,请引用以下文献:
@article{Slow_Thinking_with_LLMs_1, title={Enhancing LLM Reasoning with Reward-guided Tree Search}, author={Jiang, Jinhao and Chen, Zhipeng and Min, Yingqian and Chen, Jie and Cheng, Xiaoxue and Wang, Jiapeng and Tang, Yiru and Sun, Haoxiang and Deng, Jia and Zhao, Wayne Xin and Liu, Zheng and Yan, Dong and Xie, Jian and Wang, Zhongyuan and Wen, Ji-Rong}, journal={arXiv preprint arXiv:2411.11694}, year={2024} }
@article{Slow_Thinking_with_LLMs_2, title={Imitate, Explore, and Self-Improve: A Reproduction Report on Slow-thinking Reasoning Systems}, author={Min, Yingqian and Chen, Zhipeng and Jiang, Jinhao and Chen, Jie and Deng, Jia and Hu, Yiwen and Tang, Yiru and Wang, Jiapeng and Cheng, Xiaoxue and Song, Huatong and Zhao, Wayne Xin and Liu, Zheng and Wang, Zhongyuan and Wen, Ji-Rong}, journal={arXiv preprint arXiv:2412.09413}, year={2024} }

AISHELL/AISHELL-1
Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。
hugging_face 收录
Beijing Traffic
The Beijing Traffic Dataset collects traffic speeds at 5-minute granularity for 3126 roadway segments in Beijing between 2022/05/12 and 2022/07/25.
Papers with Code 收录
China Air Quality Historical Data
该数据集包含了中国多个城市的空气质量历史数据,涵盖了PM2.5、PM10、SO2、NO2、CO、O3等污染物浓度以及空气质量指数(AQI)等信息。数据按小时记录,提供了详细的空气质量监测数据。
www.cnemc.cn 收录
MIT Indoor Scenes
室内场景识别是高水平视觉中一个具有挑战性的开放性问题。大多数适用于室外场景的场景识别模型在室内领域的表现都较差。该数据库包含67个室内类别,共15620张图像。图像的数量因类别而异,但每个类别至少有100张图像。所有图像均为jpg格式。此处提供的图像仅用于研究目的。
阿里云天池 收录
中国食物成分数据库
食物成分数据比较准确而详细地描述农作物、水产类、畜禽肉类等人类赖以生存的基本食物的品质和营养成分含量。它是一个重要的我国公共卫生数据和营养信息资源,是提供人类基本需求和基本社会保障的先决条件;也是一个国家制定相关法规标准、实施有关营养政策、开展食品贸易和进行营养健康教育的基础,兼具学术、经济、社会等多种价值。 本数据集收录了基于2002年食物成分表的1506条食物的31项营养成分(含胆固醇)数据,657条食物的18种氨基酸数据、441条食物的32种脂肪酸数据、130条食物的碘数据、114条食物的大豆异黄酮数据。
国家人口健康科学数据中心 收录