您所在的位置: 成果库 一种基于Fisher超向量的说话人识别方法及系统

一种基于Fisher超向量的说话人识别方法及系统

成果类型:: 发明专利

发布时间: 2022-10-13 10:29:29

科技成果产业化落地方案
方案提交机构:天津市滨海新区| 门松 | 2022-10-30 10:46:56
本发明适用于语音识别技术领域,提供了一种基于Fisher超向量的说话人识别方法及系统,所述方法包括:提取Fisher超向量;将提取的Fisher超向量划分为多个Fisher子向量集;基于非参数区分分析算法对每个Fisher子向量集进行分析,以建立子空间说话人模型;根据子空间说话人模型获取待识别说话人的参考向量以及训练样本说话人的参考向量,并根据预设的计算规则,待识别说话人的参考向量以及训练样本说话人的参考向量对待识别说话人进行识别。本发明将语音数据中的Fisher超向量作为表征说话人的个性信息,并采用子空间分析建模技术在Fisher超向量的基础上进行说话人识别,有效提高系统的识别性能。
一种基于Fisher超向量的说话人识别方法,其特征在于,所述方法包括:提取Fisher超向量;将提取的所述Fisher超向量划分为多个Fisher子向量集;基于非参数区分分析算法对每个Fisher子向量集进行分析,以建立子空间说话人模型;根据所述子空间说话人模型获取待识别说话人的参考向量以及训练样本说话人的参考向量,并根据预设的计算规则,以及所述待识别说话人的参考向量以及所述训练样本说话人的参考向量对所述待识别说话人进行识别。

随着计算机技术及互联网技术的不断进步,智能设备在人们的生活中已经变得越 来越不可或缺。而作为人与智能设备之间交互方式之一的语音交互,由于其具有采集简便、 易于存储、难于模仿、语音获取的成本低廉等特性,也成为了研究领域的热点。

目前的智能语音处理方式,根据所利用的语音信息的不同,主要分为;语音识别 (Speech Reco即ition)、语种识别(Xanguage Reco即ition) W及说话人识别(Speaker Recognition)等。其中,语音识别的目标在于判断出语音信号中所传递的是何种语义信息; 语种识别的目标是识别出语音信号所属的语言种类或者方言类型;说话人识别则是通过提 取表征说话人的个性特征,识别出说话人的身份。

发明人:李志锋;李娜;乔宇 联系方式:0755-86392458 中国科学院深圳先进技术研究院提升了粤港地区及我国先进制造业和现代服务业的自主创新能力,推动我国自主知识产权新工业的建立,成为国际一流的工业研究院。 深圳先进院目前已初步构建了以科研为主的集科研、教育、产业、资本为一体的微型协同创新生态系统,由九个研究平台,国科大深圳先进技术学院,多个特色产业育成基地、多支产业发展基金、多个具有独立法人资质的新型专业科研机构等组成。开展先进技术研究,促进科技发展。信息、电子、通讯技术研究新材料、新能源技术研究高性能计算、自动化、精密机械研究生物医学与医疗仪器研究相关学历教育、博士后培养与学术交流。

本发明实施例与现有技术相比存在的有益效果是:本发明实施例提取语音数据中 的Fisher超向量作为说话人的特征向量,并采用子空间分析建模技术在Fisher超向量的 基础上进行说话人识别。由于Fisher超向量提取简单,且具有比JFA超向量更高的维度, 而且没有做过信道补偿处理,从而可有效提高说话人识别的准确率和效率。另外,本发明实 施例在上述识别过程中不需要增加额外的硬件,从而可有效降低成本,具有较强的易用性 和实用性。

技术合作

以上所述实施例仅用W说明本发明的技术方案,而非对其限制;尽管参照前述实 施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可W对前述各 实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而该些修改 或者替换,并不使相应技术方案的本质脱离本发明实施例各实施例技术方案的精神和范 围。