小样本训练的语种定制智能语音识别系统
价格 双方协商
地区: 江苏省 苏州市 常熟市
需求方: 常熟***公司
行业领域
电子信息技术
需求背景
全球智能语音识别错误率连续降低,国内智能语音厂商也在不断不断刷新准确率上限,中国智能语音应用层技术已经完全达到落地标准,而本项目公司定位为人工智能语音技术产品和服务提供商,主要通过医疗、广电等提供语种定制智能语音解决方案,但目前主流的标注模型学习训练时间长,对于高频定制化开发来说是难以接受如此长周期,这就需要提供一种高频高效的训练模型。
需解决的主要技术难题
通过深度学习、人工智能算法,降低样本训练,实现高频可定制的差异化性能;通过建立管理和测试的中文引擎系统,同时建立数据标注和模型训练的方言引擎系统,实现中文、方言语言数据处理识别。
期望实现的主要技术目标
小样本下(如<100小时)模型学习的效率,能够实现其它方法1000小时标注量的效果;能够支持闽南语、粤语、维吾尔族语等不少于8种小语种定制模型。
通过重构高层特征,根据分布参数生成易于分类的类别分布,然后通过损失函数进行优化整个网络参数及每个类别分布的参数,从而使得学习出来的高层表征有一个分布族能够精确的描述,而且高层表征的分布与其度量函数可以完全匹配,提升了小样本分类的准确率。