一种基于细粒度图像分类的快速识别方法
成果类型:: 发明专利
发布时间: 2026-05-15 09:44:57
本发明公开了一种基于细粒度图像分类的快速识别方法,属于深度学习及图像分类技术领域,包括从网络爬取目标图片,制作数据集,用于网络训练和测试,一张图片中实际只有二分之一的区域甚至是四分之一的区域是用于细粒度图像分类,其余部分都是背景区域和干扰噪音,并且图片中不同区域对分类结果的贡献度是不同的,运用Grad‑CAM注意力机制获取高贡献度区域和低贡献度区域,进行框定和裁剪,分别将高贡献度区域和低贡献度区域进行特征融合,将两个计算结果同时送入贡献度模块,通过不同的贡献度影响值计算分类结果。本发明填补了细粒度图像分类在快速识别领域的应用空白。
该方法的核心技术在于“互通道损失”与“掩码生成模块”的协同设计。其以轻量级网络为骨干,通过双线性注意力池化提取高阶特征;创新点在于设计了一个自监督的掩码生成模块,自动聚焦辨别性部件(如鸟喙、翼羽)特征,无需人工标注边界框。通过互通道损失与特定排序损失函数,隐式地引导网络比较不同图像在关键判别区域上的细微差异。整个网络为端到端结构,无需复杂推理流程,极大降低了计算冗余。
该方法可广泛应用于智能手机植物拍照识别、电商服装图像检索、工业产品瑕疵检测及野生动物监测等场景。特别适用于需要在计算资源受限的边缘设备上(如手机、无人机)快速、准确地识别亚种、车型或产品型号等精细类别。随着AIoT的发展,对无需联网、低延迟、高精度细粒度识别模型的需求日益迫切。该技术还可拓展至医学图像病灶良恶性鉴别及遥感影像目标细分类等领域。
燕山大学坐落于海滨城市秦皇岛,是河北省人民政府与教育部、工业和信息化部、国家国防科技工业局四方共建的全国重点大学。学校源于1920年建校的哈尔滨工业大学,1960年独立办学定名为东北重型机械学院,1978年即被确定为全国重点大学,1997年整体南迁后更名为燕山大学。作为典型的以工学见长的多科性大学,学校拥有机械工程、材料科学与工程等5个国家重点学科,工程学、材料科学等5个学科进入ESI全球排名前1%,其中工程学已跻身前1‰。学校在重型机械成套设备、亚稳材料科学与技术等领域的研究具有国际先进水平,已培养出大批服务国家装备制造业的卓越工程人才。
本成果产生的效益显著。终端体验上,使手机端鸟类、花卉识别应用响应更流畅,且无需上传图片保护用户隐私。工业效益上,在高速生产线上对带有微小缺陷的工业零件进行实时分拣,替代人工目检,提升效率与良品率。经济效益上,可集成至低算力芯片,大幅降低智能设备的硬件成本。社会效益上,为生物多样性保护提供高效监测工具,助力濒危物种的快速识别统计。产业层面,推动边缘计算环境下的智能视觉应用落地进程。
技术转让,许可,合作所需资金需双方协商,此项技术想尽快落地,希望具备此项技术研发的技术方,能够尽快承接此项目。