本发明公开了一种基于细粒度编码的语音分离方法、装置及存储介质,该方法包括粗分离阶段和细分离阶段,粗分离阶段先在单阶隐域所定义的粗粒度编码空间中初步分离混合语音,细分离阶段利用细粒度编码机制,将已存在的单阶隐域分解为高阶隐域,构建一个细粒度的编码空间,从而对初步分离的结果实现更加细粒度的特征分离。本发明设计了一个逐步细化的语音分离框架,可提供更精细的语音分离。
基于细粒度编码的语音分离方法通过高精度的时频特征分析和深度神经网络建模,可有效分离重叠语音、噪声干扰及混响环境下的目标声源。其应用涵盖智能语音助手(如会议转录、实时翻译)、助听器降噪、安防监控(声纹识别与异常检测)、影视后期配音分离等场景。在复杂声学环境(如车载通话、工业现场)中表现优异,同时可扩展至音乐源分离(人声与乐器分离)及医学听力学领域(耳鸣抑制)。该技术对低信噪比语音的增强效果显著,满足实时处理需求,适用于边缘计算设备与云端协同处理架构。
哈尔滨工业大学(深圳)(Harbin Institute of Technology, Shenzhen)是哈尔滨工业大学与深圳市人民政府合作共建的高水平研究型大学校区,成立于2017年(前身为2002年设立的哈工大深圳研究生院)。依托哈工大“双一流”A类高校的学科优势,聚焦粤港澳大湾区发展需求,形成“一校三区”(哈尔滨、威海、深圳)协同发展格局。
校区以工科为主,涵盖理、工、管、经、文、艺等多学科,设有10个学院及4个研究院,开设33个本科专业和58个硕博学科方向,重点发展计算机科学与技术、机械工程、材料科学、人工智能等前沿领域。拥有7个国家级重点实验室分室、3个院士工作站,与华为、腾讯等企业深度合作,科研经费年均超10亿元。校区以“新工科”教育和国际化办学为特色,60%教师具有海外经历,致力培养创新型人才,成为辐射大湾区的科技创新高地。
评价单位:- (-)
评价时间:2025-05-28
综合评价
该项目技术思路方向很好,未来市场空间大,有利于当前政策要求,转化成熟度很高,值得支持推广。建议强化相应产品开发,加大产业链开发力度。技术转让,所需资金需双方协商,此项技术想尽快落地,希望具备此项技术研发的技术方,能够尽快承接次项目。
查看更多>