成果介绍
本发明提供了一种生成句法树的方法及装置,该方法包括:将N元语法的替换规则转换为二元语法的替换规则;根据二元语法的替换规则,生成左端词性匹配语法、右端词性匹配语法;根据左端词性匹配语法,生成左端词性匹配索引表,生成左端词性祖先表;根据右端词性匹配语法,生成右端词性匹配索引表,生成右端词性祖先表;读取待处理语句;根据二元语法的替换规则、左端词性匹配语法、右端词性匹配语法、左端词性匹配索引表、右端词性匹配索引表、左端词性祖先表和右端词性祖先表,对待处理语句进行处理,生成待处理语句对应的句法树。
成果亮点
本发明获取对应位置词汇的词性后,通过双端词性匹配模型可以确定少量有效的替换规则,筛除大量无效的替换规则,从而提高句法树的生成速度;这种方法通过深度优先剪枝避免遍历无效“右子树”,从而减少无效匹配次数;在该过程中获取子句两端词汇的词性,借助双端词性匹配模型确定有效替换规则,并据此进行遍历,简单高效。此外,本发明引入符号进行等效迭代转换,将N元文法转换为二元文法,减少资源消耗,提高了句法树的生成效率和形态稳定性。
团队介绍
自己在浪潮集团工作期间的成果,所在团队聚集公司核心技术研发团队,专注“面向工程科技领域的大数据应用服务平台的研发和产业化”项目。自己担任项目总负责人,总体负责项目实施。团队以林巍、华勇、罗天3人为核心成员,均为北京大学等名校研究生,具有甲骨文等知名企业的研发经历。团队配备专业技术人员41名,其中研发工程师30名,90%以上拥有本科学历,研究生11名,均为具有云计算、大数据等关键技术开发经验的研发骨干。另有相关配套的策划和平台运营人员。
成果资料