成果介绍
本成果提出一种利用大型语言模型(LLM)的标准分析图谱构建方法及系统,旨在解决传统标准文档分析中信息提取效率低、关联关系挖掘不足的问题。通过预定义标准文档框架提取属性结构单元,构建单一标准知识图谱,再通过多层级对齐技术整合多标准图谱关联,生成涵盖规范性引用、术语语义关联等维度的标准分析图谱。系统利用 BERT 模型进行语义分析,结合 LDA 主题模型实现跨标准主题聚类,提升标准文档的可访问性与分析效率,适用于电力系统等领域的标准管理场景。
成果亮点
成果创新性地融合 LLM 与知识图谱技术:通过关键词匹配与语义分析双重机制提取标准实体,构建分层级知识结构,多跳搜索 F1 分数较传统方法提升 37%;多层级对齐技术实现规范性引用、术语定义等多维度关联,支持跨标准主题聚类与语义检索;实验验证显示,系统在 5 跳搜索中仍保持 0.68 的 F1 分数,显著优于朴素嵌入方法。该技术突破传统文本分析局限,为标准文档的智能化管理提供了高效解决方案。
团队介绍
本成果研发团队由国网辽宁省电力有限公司电力科学研究院与北京国网信通埃森哲信息技术有限公司联合组成,汇聚电力系统标准管理、自然语言处理、知识图谱构建等领域专业人才。团队深耕电力行业标准智能化分析,核心成员具备 10 年以上电力标准研究与信息技术开发经验,在大型语言模型应用、知识图谱构建等方向积累深厚,致力于通过跨学科技术融合推动电力标准管理的数字化转型。
成果资料