智能机器人的声纹识别与语音合成关键技术
价格 双方协商
地区: 浙江省 宁波市 余姚市
需求方: 浙江***究院
行业领域
高端装备制造产业
需求背景
随着计算机技术的飞速发展,语音交互的方式在很多场景下开始逐步取代传统的文本输入输出的方式。本项目着眼于新一代智能人机交互的关键技术方向,并基于机器学习和深度学习等人工智能技术,旨在打通基于语音的人机交互方式的重点环节。本项目不仅仅着眼于语义交互,同时也注重说话人的身份验证和基本信息(包括性别和年龄) 识别。具体地,本项目主要解决的问题有:声纹识别、语音合成,以及基于语音的年龄识别和性别识别。
需解决的主要技术难题
1:声纹识别。随着计算机技术的飞速发展,语音交互的方式在很多场景下开始逐步取代传统的文本输入输出的方式。
2:语音合成。即说话人识别,根据应用不同又可以分为两种: 说话人辨认和说话人确认。其中,说话人辨认是指在一个说话人集合中匹配出待测说话者的身份,而说话人确认旨在确定待测说话者是否是系统录入的特定说话人。
3:性别和年龄识别。目的是对于给任意一段文本输入,得到一段对应的语音信号。
期望实现的主要技术目标
本项目主要研究文本无关的声纹识别技术。关键在于既要保证语音信号的文本准确性又要保证语音的自然度。传统的基于参数和成和基于波形拼接的方法都无法同时保障这两点要求,而基于深度学习的方法得益于复杂度更好的模型和规模更大的数据集,从而能更好的实现这两点要求。目的是对于给定任意一段说话人的说话语音,得到说话人自身归属的性别和大致年龄段。