five

Nexdata/Mixed_Speech_with_Chinese_and_English_Data_by_Mobile_Phone|语音识别数据集|多语言混合语音数据集

收藏
hugging_face2024-04-17 更新2024-03-04 收录
语音识别
多语言混合语音
下载链接:
https://hf-mirror.com/datasets/Nexdata/Mixed_Speech_with_Chinese_and_English_Data_by_Mobile_Phone
下载链接
链接失效反馈
资源简介:
该数据集由3972名来自中国七大方言区的母语者录制,内容涵盖中文和英文混合句子的通用场景和人与计算机交互场景。数据内容丰富,转录准确,旨在提升语音识别系统对中英文混合朗读语音的识别效果。
提供机构:
Nexdata
原始信息汇总

数据集概述

数据集名称

  • 名称: Nexdata/Mixed_Speech_with_Chinese_and_English_Data_by_Mobile_Phone

数据集描述

数据集摘要

  • 描述: 该数据集由3972名中国母语者录制,涵盖七大方言区。内容为中英文混合句,适用于一般场景及人机交互场景,旨在提升语音识别系统对中英文混合朗读语音的识别效果。
  • 链接: 详细信息

支持的任务和排行榜

  • 任务: 自动语音识别(ASR)、音频说话人识别

语言

  • 语言: 中文、英文

数据集结构

数据实例

  • 信息: 待补充

数据字段

  • 信息: 待补充

数据分割

  • 信息: 待补充

数据集创建

来源数据

  • 源语言生产者: 待补充

注释

  • 注释者: 待补充

使用数据的考虑

数据集的社会影响

  • 信息: 待补充

数据集的偏见讨论

  • 信息: 待补充

附加信息

数据集管理者

  • 信息: 待补充

许可证信息

  • 许可证: 商业许可证,详情见链接

引用信息

  • 信息: 待补充
用户留言
有没有相关的论文或文献参考?
这个数据集是基于什么背景创建的?
数据集的作者是谁?
能帮我联系到这个数据集的作者吗?
这个数据集如何下载?
点击留言
数据主题
具身智能
数据集  4098个
机构  8个
大模型
数据集  439个
机构  10个
无人机
数据集  37个
机构  6个
指令微调
数据集  36个
机构  6个
蛋白质结构
数据集  50个
机构  8个
空间智能
数据集  21个
机构  5个
5,000+
优质数据集
54 个
任务类型
进入经典数据集
热门数据集

中国区域交通网络数据集

该数据集包含中国各区域的交通网络信息,包括道路、铁路、航空和水路等多种交通方式的网络结构和连接关系。数据集详细记录了各交通节点的位置、交通线路的类型、长度、容量以及相关的交通流量信息。

data.stats.gov.cn 收录

ROBEL

ROBEL是一个开源的低成本机器人平台,专为现实世界的强化学习设计。该平台由谷歌研究院和加州大学伯克利分校共同开发,包含两个机器人:D'Claw,一个三指手机器人,用于促进精细操作任务的学习;D'Kitty,一个四足机器人,用于促进敏捷的腿式移动任务学习。这些模块化机器人易于维护且足够坚固,能够承受从零开始的硬件强化学习,目前已记录超过14000小时的训练时间。ROBEL提供了一系列连续控制基准任务,这些任务具有密集和稀疏的任务目标,并引入了硬件安全评分指标。数据集和相关材料可在www.roboticsbenchmarks.org访问,旨在解决强化学习在真实机器人上的应用问题,特别是在处理物理限制和环境交互方面的挑战。

arXiv 收录

中国交通事故深度调查(CIDAS)数据集

交通事故深度调查数据通过采用科学系统方法现场调查中国道路上实际发生交通事故相关的道路环境、道路交通行为、车辆损坏、人员损伤信息,以探究碰撞事故中车损和人伤机理。目前已积累深度调查事故10000余例,单个案例信息包含人、车 、路和环境多维信息组成的3000多个字段。该数据集可作为深入分析中国道路交通事故工况特征,探索事故预防和损伤防护措施的关键数据源,为制定汽车安全法规和标准、完善汽车测评试验规程、

北方大数据交易中心 收录

中国气象数据

本数据集包含了中国2023年1月至11月的气象数据,包括日照时间、降雨量、温度、风速等关键数据。通过这些数据,可以深入了解气象现象对不同地区的影响,并通过可视化工具揭示中国的气温分布、降水情况、风速趋势等。

github 收录

URPC系列数据集, S-URPC2019, UDD

URPC系列数据集包括URPC2017至URPC2020DL,主要用于水下目标的检测和分类。S-URPC2019专注于水下环境的特定检测任务。UDD数据集信息未在README中详细描述。

github 收录