您所在的位置: 需求库 技术需求 小样本训练的语种定制智能语音识别系统

小样本训练的语种定制智能语音识别系统

发布时间: 2023-10-12
截止日期:2024-10-12

价格 双方协商

地区: 江苏省 苏州市 常熟市

需求方: 常熟***公司

行业领域

电子信息技术

需求背景

全球智能语音识别错误率连续降低,国内智能语音厂商也在不断不断刷新准确率上限,中国智能语音应用层技术已经完全达到落地标准,而本项目公司定位为人工智能语音技术产品和服务提供商,主要通过医疗、广电等提供语种定制智能语音解决方案,但目前主流的标注模型学习训练时间长,对于高频定制化开发来说是难以接受如此长周期,这就需要提供一种高频高效的训练模型。

需解决的主要技术难题

通过深度学习、人工智能算法,降低样本训练,实现高频可定制的差异化性能;通过建立管理和测试的中文引擎系统,同时建立数据标注和模型训练的方言引擎系统,实现中文、方言语言数据处理识别。

期望实现的主要技术目标

小样本下(如<100小时)模型学习的效率,能够实现其它方法1000小时标注量的效果;能够支持闽南语、粤语、维吾尔族语等不少于8种小语种定制模型。

通过重构高层特征,根据分布参数生成易于分类的类别分布,然后通过损失函数进行优化整个网络参数及每个类别分布的参数,从而使得学习出来的高层表征有一个分布族能够精确的描述,而且高层表征的分布与其度量函数可以完全匹配,提升了小样本分类的准确率。

需求解析

解析单位:江苏省苏州市 解析时间:2023-10-17

刘全

苏州大学

教授

综合评价

对于语音合成方面,针对语种进行音素发音纠正,使得文本转音素的准确率的提高。能够适应不同语种的不同情况,小语种面对的发音错误,包括音调错误等,均可实现一定程度上的降低。在小语种声学模型训练方面,在小语种小样本的条件下,利用非目标音色非目标语种做目标音色目标语种的增强数据,可以在面对数据量有限的小样本小语种,训练数据不足的情况下,利用该种训练增强方法,实现低成本高质量的语音合成。
查看更多>
更多