您所在的位置: 成果库 基于概念信息语义相似度的智能问答系统

基于概念信息语义相似度的智能问答系统

发布时间: 2022-10-08

基本信息

合作方式: 技术转让
成果类型: 发明专利
行业领域:
新一代信息技术产业,人工智能
成果介绍
文本语义相似度是指两个句子或文本片段之间的语义等价程度,其研究在自然语言处理的问答系统、机器翻译、信息抽取、自动摘要等相关领域中有着广泛的应用,具有重要的理论意义和应用价值。现有的文本语义相似度方法主要基于词表面特征,但由于词语间普遍存在概念上的关联,缺乏概念层面的精确计算导致这些方法的准确性提升困难,而实现全文本在概念层面的精确计算尚无有效模型。 项目团队依据单个名词的概念信息量为基础,分别提出了多种模型和方法实现文本在概念级别快速、精确地计算语义相似度:(1)提出一种基于概念信息量的文本语义相似度无监督基本模型;(2)提出一种基于概念信息增益的文本信息量计算方法;(3)提出一种融合信息权重的全文本信息量计算方法。实验结果表明,团队提出方法在SemEval 2013-2016 STS(文本语义相似度)数据集上均超过了当年最先进系统的总成绩,并且在SemEval 2017 STS国际测评中,本系统的总成绩在所有参赛团队中排名第二,其中在Track 1数据集上排名第一(共34个参赛团队提交81个系统)。相关论文被大会评选为“Best of SemEval 2017”。
成果亮点
文本语义相似度在自然语言处理的问答系统、机器翻译、信息抽取、自动摘要等研究中有着广泛的应用,具有重要的理论意义和应用价值。随着人工智能相关技术的发展,智能问答系统应用在许多行业和领域中都有迫切的需求。在特定领域的问答匹配多个测试数据集上的实验结果显示,相对于谷歌最新发布的深度计算模型BERT(该模型已刷榜11项自然语言处理传统任务),概念信息语义相似度无监督模型已经比当今最优深度学习模型高出13%-15%。
团队介绍
本项目来源于北京理工大学相关技术团队,北京理工大学是首批“高等学校科技成果转化和技术转移基地”,北京理工大学技术转移中心入选了“国家技术转移示范机构”,并被授予“北京市科技成果转化统筹协调与服务平台共建机构”“中关村国家自主创新示范区高校技术转移办公室”“北京理工大学专利运营办公室”等荣誉称号,是“北京高校技术转移联盟”秘书长单位和常驻地。近年来,技术转移中心所开展的相关工作被中央电视台、《人民日报》等权威媒体报道逾百次。
成果资料
产业化落地方案
点击查看