本发明提供了一种基于相似数据检测的云存储冗余数据预测方法和设备,其中方法包括:对云存储数据进行分块,得到数据块;遍历所有数据块,利用哈希算法计算出数据块对应的哈希指纹;利用N‑transform方法计算数据块的相似特征组;根据待预测的数据集的大小,选定m个数据块;遍历提取的所有数据块组成的数据块集合。
利用伯努利二项分布循环选取m个初始样本;遍历初始样本组成的初始样本集,基于哈希指纹和相似特征组进行判断,将其中不符合哈希指纹和相似特征组条件的重复数据块添加到基样本中,得到基样本集;遍历待预测的数据集,并基于基样本集确定重复数据和相似数据,从而计算数据冗余的估计值。本发明能够有效地提高云存储冗余数据的去重性能。
南华大学是由工业和信息化部、国家国防科技工业局、中国核工业集团公司、中国核工业建设集团公司与湖南省人民政府共建,成立于1958年的全日制公立综合性大学。学校由原隶属中国核工业部的中南工学院、核工业第六研究所与原隶属湖南省的衡阳医学院合并组建而成。学校座落在历史文化名城湖南省衡阳市市区,占地面积3000亩。团队成员有田纹龙,刘琪菲,耿雨晴,万亚平,欧阳纯萍,李跃,刘洋,何婷婷。
评价单位:- (-)
评价时间:2023-06-07
综合评价
该技术具有较强的财务盈利能力,其财务净现值良好,投资回收期合理。综上所述,技术的经济和社会效益客观,技术的投产将改善优化当地产业结构,实现高质量发展的目标。
查看更多>