Chinese Legal Documents|法律数据集|自然语言处理数据集
收藏
- 首次公开发布中国法律文献数据集,标志着中国法律信息系统化的开端。
- 中国法律文献数据集首次应用于司法实践中,提升了法律判决的效率和准确性。
- 数据集进行了重大更新,引入了更多详细的法律条文和案例分析,增强了数据集的实用性和深度。
- 中国法律文献数据集开始与国际法律数据库进行合作,促进了国际法律信息的交流与共享。
- 数据集进一步整合了人工智能技术,实现了法律文本的自动分类和智能检索,极大地提升了数据处理能力。
- 1Chinese Legal Documents: A Comprehensive Dataset for Legal Text AnalysisTsinghua University · 2021年
- 2Legal Judgment Prediction via Multi-Task Learning in Chinese Legal DocumentsPeking University · 2022年
- 3Exploring the Use of BERT for Legal Text Classification in Chinese Legal DocumentsShanghai Jiao Tong University · 2021年
- 4A Comparative Study of Text Embeddings for Legal Document Retrieval in Chinese Legal DocumentsZhejiang University · 2022年
- 5Legal Entity Recognition in Chinese Legal Documents using Deep Learning ApproachesFudan University · 2021年
CE-CSL
CE-CSL数据集是由哈尔滨工程大学智能科学与工程学院创建的中文连续手语数据集,旨在解决现有数据集在复杂环境下的局限性。该数据集包含5,988个从日常生活场景中收集的连续手语视频片段,涵盖超过70种不同的复杂背景,确保了数据集的代表性和泛化能力。数据集的创建过程严格遵循实际应用导向,通过收集大量真实场景下的手语视频材料,覆盖了广泛的情境变化和环境复杂性。CE-CSL数据集主要应用于连续手语识别领域,旨在提高手语识别技术在复杂环境中的准确性和效率,促进聋人与听人社区之间的无障碍沟通。
arXiv 收录
Beijing Traffic
The Beijing Traffic Dataset collects traffic speeds at 5-minute granularity for 3126 roadway segments in Beijing between 2022/05/12 and 2022/07/25.
Papers with Code 收录
LibriSpeech
LibriSpeech 是一个大约 1000 小时的 16kHz 英语朗读语音语料库,由 Vassil Panayotov 在 Daniel Povey 的协助下编写。数据来自 LibriVox 项目的已读有声读物,并经过仔细分割和对齐。
OpenDataLab 收录
AISHELL/AISHELL-1
Aishell是一个开源的中文普通话语音语料库,由北京壳壳科技有限公司发布。数据集包含了来自中国不同口音地区的400人的录音,录音在安静的室内环境中使用高保真麦克风进行,并下采样至16kHz。通过专业的语音标注和严格的质量检查,手动转录的准确率超过95%。该数据集免费供学术使用,旨在为语音识别领域的新研究人员提供适量的数据。
hugging_face 收录
糖尿病预测数据集
糖尿病相关的医学研究或者健康数据
AI_Studio 收录