“局域网档案智能语义检索技术”科技成果转化公示
发布时间: 2026-05-16
按照《科技成果转化实施证明工作规范》(Q/ZZZK-001-2024)标准相关规定,拟对王爱作为成果主要负责人的一项科技成果实施转化,现将相关信息公示如下:
科技成果名称:局域网档案智能语义检索技术
专利名称:一种局域网数字档案的语义关联方法
专利号:ZL202511014195.X
专利类型:发明专利
成果负责人:王爱(发明人团队:王爱、张丽彩、朱秀丽、郝彩玲、赵楠、石璞)
一、科技成果转化协议
协议类型:专利实施许可协议
许可方:王爱
被许可方:徐州创**院有限公司(企业要求不公布全名)
签订日期:2026 年 04 月 26 日
许可有效期:2026 年 04 月 26 日 —2028 年 04 月 26 日
-徐州创***院有限公司获得本发明专利合法实施许可。本成果主要解决传统局域网数字档案检索仅靠字面匹配、缺乏语义理解、无法关联上下文、检索准确率低、同义不同词易漏检、多维度档案融合检索能力弱等行业痛点。通过分词向量处理、词语位置关联、TextRank 权重优化、语义加权计算、档案向量建模、余弦相似度匹配等核心算法,实现语义级智能检索、上下文关联匹配、检索结果精准排序,可广泛应用企事业单位内网档案库、政务文书库、校园资料室、企业文档中心等场景,显著提升档案查阅效率与智能化管理水平。
三、成果概述
本发明属于大数据与自然语言处理、数字档案智能检索技术领域,提出一套面向局域网环境的数字档案语义关联检索方法。流程包含:检索文本分词与词向量提取;词语位置关联性与语义修正权重计算;语句向量与档案向量建模;基于余弦相似度完成语义匹配与结果排序。突破传统关键词匹配局限,融合词语位置距离、共现频次、句子长度、语义关联度多维度因子,自适应优化权重,有效解决同义和近义检索遗漏、上下文语义割裂、检索结果杂乱等问题,具备算法严谨、适配性强、易部署落地的特点。
四、技术特点
多维度语义融合建模
综合词语位置距离、共现次数、句子长度、语义关联度多维因子,构建复合权重体系,检索更贴合真实语义需求。
自适应权重修正机制
基于 TextRank 算法优化边权重,结合文档共现特征动态修正,规避低频词权重失真问题,提升模型鲁棒性。
语句 — 档案双层向量构建
分别建立检索语句向量与全局档案向量,层级化建模,匹配逻辑更严谨、检索精度更高。
上下文关联深度识别
打破字面匹配局限,可理解语义内涵、关联上下文逻辑,支持模糊检索、同义检索、关联档案智能推荐。
局域网专属轻量化设计
适配内网离线环境,无需依赖外网大模型,占用资源低、响应速度快,部署简单、兼容性强。
检索结果智能排序
按语义关联度自动降序排列,优先输出高相关档案,减少人工筛选工作量。
五、产品 / 应用优势
检索准确率大幅提升
从传统关键词匹配升级为语义智能匹配,有效减少漏检、误检,档案查找精准度显著提高。
支持同义模糊检索
近义词、相关表述可智能关联匹配,不用严格输入 exact 关键词,降低检索门槛。
内网离线安全可用
纯本地化算法运行,不泄露档案数据,满足政务、企事业单位内网保密管控要求。
提升档案管理效率
实现海量档案快速定位、智能归类、关联推荐,大幅节省人工查阅、整理时间。
通用性强、落地成本低
适配政务、教育、医疗、企业、园区等各类局域网档案系统,可快速对接现有库,改造量小。
专利技术壁垒高
发明专利核心算法受保护,技术方案成熟,具备行业推广与市场化转化价值。
五、利害关系
经查,成果受让方与该职务科技成果完成人之间无利害关系。
六、异议处理
任何单位和个人如果对公示名单有异议,可在公示期内以书面形式提出,并列举异议理由和相关证明材料。以个人名义提出异议的,需要写明自己的真实姓名、单位、联系地址及电话等;以单位名义提出的,需加盖单位公章。原则上匿名异议不予受理。
七、联系方式
北京中知中科技术开发有限公司科技成果转化委员会
地址:北京市丰台区航丰路1号时代财富天地4号楼805
邮箱:19910202367@163.com
Copyright © 2022 中国科学技术协会 版权所有 | 京ICP备16016202号-20