一种结构化数据敏感属性的识别与分类分级方法
发布时间: 2021-10-22
来源: 科创项目库
基本信息
本发明公开了结构化数据敏感属性的识别与分类分级方法,该方法包括步骤,首先根据用户需求输入待处理的结构化数据表;然后利用信息熵及最大熵计算属性的隐私敏感度;利用kmeans聚类算法对属性的敏感度进行聚类,将属性初始划分为敏感属性集和疑似敏感属性集两个簇;进一步利用Apriori算法挖掘疑似敏感属性集与敏感属性集间关联关系,将任意结构化数·据的敏感属性进最终识别为敏感属性集与非敏感属性集;最后,仅仅针对敏感属性集来操作,通过对敏感属性集中属性间的互信息相关性和关联规则分析,对敏感属性进行分类,并对各敏感属性组的平均敏感度量化,实现敏感属性的分类分级。该方法面向隐私保护能同时达到敏感属性的识别与分级效果,不需要预知结构化数据集的属性特征、敏感特征字典,兼顾了属性间的相关性和关联关系。