一种基于双学习网络的立体图像视觉显著提取方法

发布时间: 2022-11-09

来源: 科技服务团

基本信息

合作方式：技术许可

成果类型：发明专利

行业领域：

电子信息技术

成果介绍

本发明公开了一种基于双学习网络的立体图像视觉显著提取方法，其将人类注视图、立体图像的左视点彩色图像和左视差图像构成训练集；然后在训练集的基础上利用VGG网络模型中的特征提取技术构建深度学习模型；接着以训练集中的人类注视图为监督，以训练集中的左视点彩色图像和左视差图像为输入参数，对深度学习模型进行训练；再将待视觉显著提取的立体图像的左视点彩色图像和左视差图像作为输入参数，输入到训练得到的模型中，得到待视觉显著提取的立体图像的视觉显著图像；优点是其能够快速的运行检测，并且具有较强的鲁棒性和预测准确性。

成果亮点

选择一个包含有人类注视图及其对应的立体图像的数据库；然后将数据库中的每幅人类注视图缩放至80×60尺寸，将数据库中的每幅人类注视图对应的立体图像的左视点彩色图像和对应的立体图像的左视差图像均缩放至640×480尺寸；再将所有 80×60尺寸的人类注视图、所有640×480尺寸的左视点彩色图像、所有640×480尺寸的左视差图像构成训练集，将训练集中的第k幅80×60尺寸的人类注视图记为将训练集中的第k幅左视点彩色图像记为将训练集中的第k 幅左视差图像记；其中，k为正整数，1≤k≤K，K表示数据库中包含的人类注视图的总幅数，也为数据库中包含的立体图像的总幅数，K≥50，表示中坐标位置为(x80,y60) 的像素点的像素值，表示中坐标位置为(x640,y480)的像素点的像素值，表示中坐标位置为(x640,y480)的像素点的像素值，1≤x80≤80,1≤y60≤60，1≤x640≤640,1≤y480≤480

团队介绍

周武杰，1983年9月出生，副教授/博士后，硕士生导师，浙江省电子学会理事，IEEE成员，CCF成员，中国人工智能学会会员，浙江省“计算机科学与技术”一流学科B类方向负责人。2012年入选"青年骨干教师"，2015年入选"优秀青年教师资助计划"，2016年入选"科大青年英才"，2022年入选斯坦福大学发布的全球前2%顶尖科学家榜单。浙江大学信息与通信工程专业博士后，国家留学基金委公派新加坡南洋理工大学访问学者。主要从事人工智能与深度学习、机器视觉与模式识别、图像处理等方面的研究;近几年以第一作者在AAAI、TIP、TNNLS、TCSVT、TMM、TITS、TSTSP、TSMC、TBC、TGRS、TCI、MIS、TCDS、TETCI、TIV、PR和中国科学等国际权威SCI期刊或核心期刊上发表学术论文50多篇

成果资料

产业化落地方案

点击查看

成果综合评价报告

评价单位：- (-) 评价时间：2022-12-01

姜代红

徐州工程学院信息工程学院

教授

综合评价

该成果构建的深度学习模型具有用于彩色特征提取的网络块组成的彩色特征提取部分与用于视差特征提取的网络块组成的视差特征提取部分，该深度学习模型综合考虑了视差信息，相较于平面显著性检测算法准确性更高、鲁棒性更强。该项目技术思路方向很好，未来市场空间大，有利于当前政策要求，转化成熟度很高，值得支持推广。建议强化相应产品开发，加大产业链开发力度。

科创中国

友情链接

国际技术贸易

海外专利信息资源系统

省级中心站