您所在的位置: 成果库 一种基于元语义嵌入的云存储相似数据检测方法和系统

一种基于元语义嵌入的云存储相似数据检测方法和系统

发布时间: 2023-06-13

来源: 试点城市(园区)

基本信息

合作方式: 技术转让
成果类型: 发明专利
行业领域:
电子信息技术
成果介绍
本发明提供了一种基于元语义嵌入的云存储相似数据检测方法和系统,其中方法包括:对云存储数据域中的全部数据进行CDC分块;采用MinHash算法提取全部CDC块的特征向量;基于Mask算法对任一CDC块的上下文特征向量进行处理,将处理后的所有上下文特征向量输入神经网络模型进行训练,获得云存储数据域的元语义模型。
成果亮点
提取上传至云存储数据域的新数据的语义特征向量;将新数据的语义特征向量输入被元语义模型初始化后的新神经网络模型进行相似性检测。本发明基于元语义嵌入的方法嵌入了全文的语义,增强了提取数据特征的可靠性,同时避免重复训练神经网络,从而减少计算开销。
团队介绍
南华大学是由工业和信息化部、国家国防科技工业局、中国核工业集团公司、中国核工业建设集团公司与湖南省人民政府共建,成立于1958年的全日制公立综合性大学。学校由原隶属中国核工业部的中南工学院、核工业第六研究所与原隶属湖南省的衡阳医学院合并组建而成。学校座落在历史文化名城湖南省衡阳市市区,占地面积3000亩。团队成员有田纹龙,李柏松,李宇圣,万亚平,欧阳纯萍,刘永彬,李跃。
成果资料