一种钓鱼网站鉴别系统及鉴别方法,包括已知解析单元、未知解析单元和检测模块,其中,已知解析单元至少包括第一特征提取模块和分类训练模块,第一特征提取模块用于提取已知钓鱼网站URL或源码的特征向量,分类训练模块用于对已知钓鱼网站URL或源码的特征向量进行分类训练得到的特征模型,并存入检测模块中;未知解析单元至少包括第二特征提取模块,第二特征提取模块用于提取未知网站URL或源码的特征向量,并存入检测模块中。本发明提供一种钓鱼网站鉴别系统及鉴别方法,学习效率高、分类训练速度快、训练时间短,提高了钓鱼网站的鉴别速度,另外,采用多特征向量提取方法有助于增加分类的精度,提高特征向量分类的准确性。
所述已知解析单元还包括 第一获取模块(32),所述第一获取模块(32)与所述第一特征提取模块(31)连接,用于获取 已知钓鱼网站的U化或源码,并发送至所述第一特征提取模块(31)。所述未知解析单元还包括 第二获取模块(12),所述第二获取模块(12)与所述第二特征提取模块(11)连接,用于获取 未知网站的U化或源码,并发送至所述第二特征提取模块(11)。
包括W下步骤: (1) 获取已知钓鱼网站的册L或源码,提取已知钓鱼网站m?L或源码的特征向量; (2) 对已知特征向量进行分类训练解析,建立特征模型; (3) 获取未知网站的URL或源码,提取未知网站URL或源码的特征向量; (4) 将未知特征向量与所述特征模型进行对比分析,做出判定。
钓鱼网站是一种在线欺诈的手段,它模仿合法网站的网址与页面布局,迷惑互联 网用户。使用钓鱼网站进行在线诈骗的流程如下:首先钓鱼网站设计者建立钓鱼网站,然后 通过手机短信、电子邮件、即时通讯工具或者通过社区发布钓鱼网站的网址,互联网用户向 假冒的网站提交个人信息,网站获取并记录信息,进而盗取用户信息,并进行其他诈骗活 动。钓鱼网站的网址或页面与合法网站有高度的相似性,用户往往难以辨别。钓鱼网站不仅 给互联网用户带来经济损失,也给仿冒的目标带来名誉损失。
中国科学院深圳先进技术研究院提升了粤港地区及我国先进制造业和现代服务业的自主创新能力,推动我国自主知识产权新工业的建立,成为国际一流的工业研究院。 深圳先进院目前已初步构建了以科研为主的集科研、教育、产业、资本为一体的微型协同创新生态系统,由九个研究平台,国科大深圳先进技术学院,多个特色产业育成基地、多支产业发展基金、多个具有独立法人资质的新型专业科研机构等组成。开展先进技术研究,促进科技发展。信息、电子、通讯技术研究新材料、新能源技术研究高性能计算、自动化、精密机械研究生物医学与医疗仪器研究相关学历教育、博士后培养与学术交流。
本发明提供一种钓鱼网站鉴别系统及鉴别方法,采用极限学习机算法学习单层前 馈神经网络,对特征向量进行分类训练时不需要进行迭代,学习效率高,提高了分类训练速 度,极大地减少训练时间,提高了钓鱼网站的鉴别速度,另外,采用多特征向量提取方法有 助于增加分类的精度,提高特征向量分类的准确性。
技术合作
本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明 的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出 其他不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的 精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护 范围之内。