基于细粒度编码的语音分离方法、装置及存储介质
成果类型:: 发明专利
发布时间: 2025-05-26 13:56:37
本发明公开了一种基于细粒度编码的语音分离方法、装置及存储介质,该方法包括粗分离阶段和细分离阶段,粗分离阶段先在单阶隐域所定义的粗粒度编码空间中初步分离混合语音,细分离阶段利用细粒度编码机制,将已存在的单阶隐域分解为高阶隐域,构建一个细粒度的编码空间,从而对初步分离的结果实现更加细粒度的特征分离。本发明设计了一个逐步细化的语音分离框架,可提供更精细的语音分离。
本技术提出了一种创新的基于细粒度编码的语音分离解决方案。其核心技术突破在于:采用多尺度特征提取网络,实现了语音信号的精细化时频表征;创新的注意力机制设计,有效提升了语音成分的区分能力;轻量化的网络架构在保证分离精度的同时显著降低了计算复杂度。该方法克服了传统语音分离方法在复杂声学环境下性能下降的问题,为实时语音处理提供了新的技术路径。
该技术在智能语音领域具有广泛的应用价值。在通信设备方面,可显著提升嘈杂环境下的通话质量;在智能家居领域,适用于远场语音交互系统的信号增强;在会议系统应用中,能实现多说话人场景下的语音清晰分离。随着智能语音交互需求的快速增长,该技术在消费电子、车载系统、安防监控等领域都将展现出重要的应用潜力。
哈尔滨工业大学(深圳)(Harbin Institute of Technology, Shenzhen)是哈尔滨工业大学与深圳市人民政府合作共建的高水平研究型大学校区,成立于2017年(前身为2002年设立的哈工大深圳研究生院)。依托哈工大“双一流”A类高校的学科优势,聚焦粤港澳大湾区发展需求,形成“一校三区”(哈尔滨、威海、深圳)协同发展格局。校区以工科为主,涵盖理、工、管、经、文、艺等多学科,设有10个学院及4个研究院,开设33个本科专业和58个硕博学科方向,重点发展计算机科学与技术、机械工程、材料科学、人工智能等前沿领域。拥有7个国家级重点实验室分室、3个院士工作站,与华为、腾讯等企业深度合作,科研经费年均超10亿元。校区以“新工科”教育和国际化办学为特色,60%教师具有海外经历,致力培养创新型人才,成为辐射大湾区的科技创新高地。
本技术将创造显著的综合价值。在用户体验方面,可大幅提升语音交互系统的使用效果;在产业效益方面,有助于推动智能语音技术的创新发展;在经济效益方面,为相关产品带来显著的性能提升和竞争优势。该技术的推广应用还将促进我国在语音信号处理领域的技术进步,增强相关产业的核心竞争力。
技术转让,许可,合作所需资金需双方协商,此项技术想尽快落地,希望具备此项技术研发的技术方,能够尽快承接此项目。