一种基于生成式对抗网络的恶意代码对抗样本自动生成方法
成果类型:: 发明专利
发布时间: 2022-10-27 10:30:46
本发明公开了一种基于生成式对抗网络的恶意代码对抗样本自动生成方法,属于机器学习和网络安全技术领域。本发明首先选定训练用PE文件进行特征提取,得到初始特征映射向量,利用生成式对抗网络GAN对初始特征映射向量进行训练,得到对抗特征向量及对抗特征库,再使用进化算法对恶意PE文件进行对抗修改,最后经过筛选和恶意验证得到恶意代码对抗样本文件。本发明可以快速自动的生成含有恶意功能且能使分类器误分类的恶意对抗样本,且能够实现人工调整训练参数、调控系统训练方式,有效提升了生成对抗样本的真实性、高效性以及模型对抗评估的准确性。
一种基于生成式对抗网络的恶意代码对抗样本自动生成方法,其特征在于包括如下步骤:步骤1、选定训练用的恶意PE文件和良性PE文件,对PE文件进行如下操作:1.1)提取各文件的结构特征;1.2)将提取到的特征无重复的存储形成初始特征库;1.3)将各文件与所述初始特征库中的所有特征做存在性特征映射,得到所述恶意PE文件与良性PE文件各自的初始特征映射向量;步骤2、将上面得到所述初始特征映射向量输入到生成式对抗网络GAN进行训练,生成对抗特征映射向量;将此向量与所述初始特征库做对应性映射,得到对抗特征并无重复的保存生成对抗特征库;步骤3、参照所述对抗特征库,利用进化算法对上述训练用的恶意PE文件进行对抗性修改,得到对抗性修改文件集;步骤4、利用静态检测模型对步骤3中得到的对抗性修改文件集进行筛选,选择出被分类器标记为良性的文件作为规避样本集;步骤5、对上述规避样本集进行恶意功能验证,将保留训练用恶意PE文件功能的规避样本作为恶意代码对抗样本文件进行输出;
传统的基于签名的方法无法满足恶意软件的猖獗膨胀。基于机器学习的检测器具有可扩展性和高效性,在防止恶意软件的大量涌入方面取得了不错的效果。因此自2001年以来,关于使用机器学习预测恶意内容研究出现了爆炸式增长。机器学习在恶意软件防御中的应用越来越多,这引起了人们对机器学习在对抗环境中的鲁棒性的关注。许多研究工作已经证明,深度神经网络容易受到对抗性攻击。在恶意软件领域,对抗性攻击的结果尤其显著。攻击者通过对恶意软件做一些微不足道的改变而轻易地规避基于机器学习的检测器。目前已经存在攻击者试图利用商业包装和加密程序逃避检测的例子。现实世界的防病毒系统并不仅仅依赖于静态分类器,因此每当恶意软件运行时,许多静态入侵都会被动态分析检测到。目前面临的问题是,对抗性攻击可以绕过动态检测器对用户造成危害。因此,构建针对恶意代码检测机器学习模型的对抗样本,是发掘恶意代码检测模型缺陷,评估和完善恶意代码检测系统的关键。
河北师范大学是一所具有百年历史和光荣传统的省属重点大学。学校起源于1902年创建于北京的顺天府学堂和1906年创建于天津的北洋女师范学堂。1996年6月,原河北师范大学、河北师范学院与创建于1952年的河北教育学院、创建于1984年的河北职业技术师范学院合并,组建成新的河北师范大学。校友中有老一代革命家邓颖超、刘清扬、郭隆真、杨秀峰、康世恩、荣高棠等,有学界名人梁漱溟、张申府、汤用彤等,有中科院院士严陆光、郝柏林等,也有许绍发、蔡振华等一批体育界精英。新中国成立以来,学校共为国家培养了20余万名专业人才。 学校新校区占地1829亩,馆藏图书340.64万册。学校现有在职教职工2856名,其中专任教师1577人,教授405人,副教授994人,中国科学院院士1人,省级以上各类优秀专家106人,博士研究生导师108人,硕士研究生导师578人。在校本、专科生36371人,研究生4191人,成人教育学生14760人。
技术效果在于:本发明可以在无需人工干预的情况下高效生成对抗样本,生成的样本在有效对抗基于机器学习的恶意检测模型的同时,确保了对抗样本与原始恶意样本在恶意行为上的一致性,有效提升了生成对抗样本的真实性和模型对抗评估的准确性。本发明还可以实现人工调整训练参数、调控系统训练方式,提升了方法的灵活性和适应性。
技术转让,许可,合作所需资金需双方协商,此项技术想尽快落地保定,希望具备此项技术研发的技术方,能够尽快承接次项目