Mozilla更新公共语音数据集 包含18种语言共1400小时

小刘

【CNMO新闻】Mozilla近日发布了最新版本的Common Voice,这是它的开源语音数据转录集,目前包含超过1400个小时的语音样本,由4.2万名贡献者提供18种语言,包括英语、法语、德语、荷兰语、哈卡钦语、世界语、波斯语、巴斯克语、西班牙语、普通话、威尔士语和卡拜尔语。

Mozilla更新公共语音数据集 包含18种语言共1400小时
(图侵删)

Common Voice

Mozilla称,这是同类数据库中最大的多语言数据库之一,大大超过了8个月前向公众开放的普通语音语料库,该语料库包含来自2万名志愿者的500小时(40万段录音)的英语录音。该组织表示,通过共同语音网站和移动应用程序,70种语言的数据收集工作正在积极进行。

Mozilla表示,在未来的几个月里,他们将尝试不同的方法,通过社区的努力和新的合作伙伴关系来提高数据的数量和质量。该公司表示,计划利用部分录音来开发支持语音的产品,最终的目标则是提供更多更好的语音数据以寻求构建和使用语音技术。

该公司表示:“Mozilla的目标是建立一个更加多样化和创新的语音技术生态系统,公共语音网站是我们构建语音数据集的主要工具之一,这些数据集对语音交互技术非常有用。”

7月30日奥运会赛程速览转存!为中国健儿加油!

浙江加大援企稳岗力度,困难小微企业可缓交社会保险费

炎炎夏日,防晒、补水、降温喷雾能带上火车吗?

世界气象日|缩小早期预警差距,筑牢气象防灾减灾第一道防线

沪苏湖高铁开通,从“长三角之心”湖州看“江浙沪第一天路”

工作坊|早期左翼文学的多重张力与历史回响

填补车门把手空白,确保逃生有门

“琼瑶作品大全集”:火花燃烧,爱也依旧

俄军官称几乎已控制库尔斯克全境

重庆人注意!病毒变种在多个微信群,看见“@所有人”不要着急点开!

华为Mate 10国内开售时间公布 20日上市

贝壳省心租安心服务承诺再升级,扩大房屋租赁行业价值

Mozilla更新公共语音数据集 包含18种语言共1400小时的相关内容

文章版权声明:除非注明,否则均为清晨网络原创文章,转载或复制请以超链接形式并注明出处。

取消
微信二维码
微信二维码
支付宝二维码