一种基于Fisher超向量的说话人识别方法及系统
成果类型:: 发明专利
发布时间: 2022-10-13 10:29:29
随着计算机技术及互联网技术的不断进步,智能设备在人们的生活中已经变得越 来越不可或缺。而作为人与智能设备之间交互方式之一的语音交互,由于其具有采集简便、 易于存储、难于模仿、语音获取的成本低廉等特性,也成为了研究领域的热点。
目前的智能语音处理方式,根据所利用的语音信息的不同,主要分为;语音识别 (Speech Reco即ition)、语种识别(Xanguage Reco即ition) W及说话人识别(Speaker Recognition)等。其中,语音识别的目标在于判断出语音信号中所传递的是何种语义信息; 语种识别的目标是识别出语音信号所属的语言种类或者方言类型;说话人识别则是通过提 取表征说话人的个性特征,识别出说话人的身份。
本发明实施例与现有技术相比存在的有益效果是:本发明实施例提取语音数据中 的Fisher超向量作为说话人的特征向量,并采用子空间分析建模技术在Fisher超向量的 基础上进行说话人识别。由于Fisher超向量提取简单,且具有比JFA超向量更高的维度, 而且没有做过信道补偿处理,从而可有效提高说话人识别的准确率和效率。另外,本发明实 施例在上述识别过程中不需要增加额外的硬件,从而可有效降低成本,具有较强的易用性 和实用性。
技术合作
以上所述实施例仅用W说明本发明的技术方案,而非对其限制;尽管参照前述实 施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可W对前述各 实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而该些修改 或者替换,并不使相应技术方案的本质脱离本发明实施例各实施例技术方案的精神和范 围。