一种基于深度学习的立体图像视觉显著性检测方法

发布时间: 2022-11-09

来源: 科技服务团

基本信息

合作方式：技术许可

成果类型：发明专利

行业领域：

电子信息技术

成果介绍

本发明公开了一种基于深度学习的立体图像视觉显著性检测方法，其构建卷积神经网络，包含输入层、隐层、输出层，输入层包括RGB图输入层和深度图输入层，隐层包括编码框架、中间层框架和解码框架，编码框架由RGB图通道和深度图通道组成；将训练集中的每幅立体图像的左视点图像和深度图像输入到卷积神经网络中进行训练，得到训练集中的每幅立体图像的显著性图像；计算训练集中的每幅立体图像的显著性图像与真实人眼注视图像之间的损失函数值，重复执行多次后得到卷积神经网络训练模型；待测试的立体图像的左视点图像和深度图像输入到卷积神经网络训练模型中，预测得到显著性预测图像；优点是其具有较高的视觉显著性检测准确性。

成果亮点

构建卷积神经网络：该卷积神经网络包含输入层、隐层、输出层，输入层包括RGB图输入层和深度图输入层，隐层包括编码框架、中间层框架和解码框架，编码框架由RGB图通道和深度图通道组成，RGB图通道由依次设置的第1个神经网络块、第3个神经网络块、第5个神经网络块、第7个神经网络块、第9个神经网络块、第11个神经网络块、第13个神经网络块构成，深度图通道由依次设置的第2个神经网络块、第4个神经网络块、第6个神经网络块、第8个神经网络块、第10个神经网络块、第12个神经网络块、第14个神经网络块构成，中间层框架由依次设置的第15个神经网络块和第16个神经网络块构成，解码框架由依次设置的第1个反卷积块、第17个神经网络块、第2个反卷积块、第18个神经网络块、第3个反卷积块、第19个神经网络块、第4个反卷积块、第20个神经网络块构成。

团队介绍

周武杰，1983年9月出生，副教授/博士后，硕士生导师，浙江省电子学会理事，IEEE成员，CCF成员，中国人工智能学会会员，浙江省“计算机科学与技术”一流学科B类方向负责人。2012年入选"青年骨干教师"，2015年入选"优秀青年教师资助计划"，2016年入选"科大青年英才"，2022年入选斯坦福大学发布的全球前2%顶尖科学家榜单。浙江大学信息与通信工程专业博士后，国家留学基金委公派新加坡南洋理工大学访问学者。主要从事人工智能与深度学习、机器视觉与模式识别、图像处理等方面的研究;近几年以第一作者在AAAI、TIP、TNNLS、TCSVT、TMM、TITS、TSTSP、TSMC、TBC、TGRS、TCI、MIS、TCDS、TETCI、TIV、PR和中国科学等国际权威SCI期刊或核心期刊上发表学术论文50多篇

成果资料

产业化落地方案

点击查看

成果综合评价报告

评价单位：- (-) 评价时间：2022-12-01

韩成春

徐州工程学院信息工程学院

副教授

综合评价

该成果构建的卷积神经网络中的编码框架中的一些神经网络块采用卷积层来代替最大池化层，有利于保留前期特征提取的更多信息，尤其是编码框架中的RGB图通道和深度图通道深层提取的全局上下文特征，避免了由于最大池化操作而丢失的重要信息。该方法构建的卷积神经网络中的神经网络块引入了大量的残差块，构建了更深的网络而不会产生梯度消失和训练效率问题，由于这种远跳连接，低级特征可以传到更深的网络中与高级特征进行信息互补，从而实现了有效的特征融合，因此卷积神经网络可以学到更为丰富的内容。总体而言，该项目技术思路方向很好，未来市场空间大，有利于当前政策要求，转化成熟度很高，值得支持推广。建议强化相应产品开发，加大产业链开发力度。

科创中国

友情链接

国际技术贸易

海外专利信息资源系统

省级中心站