#117803#­Mozilla希望让初创公司,研究人员和业余爱好者更容易构建支持语音的利用,服务和装备。为此,它今天发布了最新版本的Common Voice,这是1个开源的语音数据集,现在包括来自42000名贡献者超过1400小时的语音样本,涵盖18种语言,包括包括英语、法语、德语、荷兰语、Hakha Chin语、世界语、波斯语、巴斯克语、西班牙语、中文、威尔士语和卡布语。
­Mozilla宣称,它是同类语言中最大的多语言数据集之1,比8个月前公然的普通语音语料库要大很多,其中包括了2万名英语志愿者500小时,40万份录音,而且语料库很快就会扩大。该组织表示,70种语言的数据搜集工作正在通过通用语音网站和移动利用程序积极展开。
­通用语音可以集成到Deepspeech中,这是1套由Mozilla的机器学习小组保护的开源的语音到文本、文本到语音引擎和经过培训的模型,它不但包括语音片断,还包括1些自愿者提供的元数据,这些元数据可用于培训语音引擎,如演讲者的年龄、性别等等。
­为了简化流程,Mozilla本周推出了1款改进的Common Voice 网络工具,可以根据不同的提示进行剪辑,还提供了用于查看、重新录制和跳过剪辑的新控件。另外,它还推出了新的配置文件功能,允许用户跨语言跟踪进度和指标,并添加人口统计信息。Mozilla表示,在接下来的几个月里,它将尝试不同的方法来通过社区努力和新的合作火伴关系,增加数据的数量和质量。终究目标旨在为那些寻求构建和使用语音技术的人提供更多更好的语音数据。
更多内容阅读推荐: 拆迁一般怎么和开发商谈判 |