一种基于残差网络及局部细化的单目深度估计方法

发布时间: 2022-11-09

来源: 科技服务团

基本信息

合作方式：技术许可

成果类型：发明专利

行业领域：

电子信息技术

成果介绍

本发明公开了一种基于残差网络及局部细化的单目深度估计方法。在训练阶段，搭建神经网络模型，其隐藏层主要包括5个部分，即inception部分、编码部分、解码部分、跳跃连接部分、以及局部细化部分；使用最初的、原始的KITTI数据库交通场景图，将其进行处理、归一化，再输入到神经网络模型中进行反复的训练，得到的深度图再与相应的标签图进行对应损失函数值的计算，得到最优权重；在测试阶段，将待测试的交通场景图输入到神经网络模型当中，并载入训练阶段的最优权重，输出标签接近的深度图，优点是提高了KITTI数据图片单目深度预测的准确性，提升了深度图的质量。

成果亮点

隐藏层的分支部分包括第一分支部分和第二分支部分，第一分支部分包括依次连接的第二个初始卷积块、第三个初始卷积块、第四个初始卷积块、第五个初始卷积块、第六个初始卷积块和第七个初始卷积块，第二个初始卷积块与输入层连接，第二个初始卷积块接收输入层的输出，第七个初始卷积块连接到第一个初始上采样残差块的输出端，第一个初始上采样残差块的输出与第七个初始卷积块的输出通过Add叠加的方式融合后再输入到第一个Dropout层。隐藏层的第二分支部分包括第一个恒等跳跃块、第二个恒等跳跃块、第三个恒等跳跃块、第四个恒等跳跃块，第一个恒等跳跃块的输入连接到第三个下采样块的输出，第一个恒等跳跃块的输出连接到第二个上采样块的输入，第一个上采样块的输出和第一个恒等跳跃块的输出通过Add叠加的方式融合后再输入到第二个上采样块。第二个恒等跳跃块的输入连接到第二个下采样块的输出，第二个恒等跳跃块的输出连接到第三个上采样块的输入，第二个上采样块的输出和第二个恒等跳跃块的输出通过Add叠加的方式融合后作为第三个上采样块的输入。

团队介绍

周武杰，1983年9月出生，副教授/博士后，硕士生导师，浙江省电子学会理事，IEEE成员，CCF成员，中国人工智能学会会员，浙江省“计算机科学与技术”一流学科B类方向负责人。2012年入选"青年骨干教师"，2015年入选"优秀青年教师资助计划"，2016年入选"科大青年英才"，2022年入选斯坦福大学发布的全球前2%顶尖科学家榜单。浙江大学信息与通信工程专业博士后，国家留学基金委公派新加坡南洋理工大学访问学者。主要从事人工智能与深度学习、机器视觉与模式识别、图像处理等方面的研究;近几年以第一作者在AAAI、TIP、TNNLS、TCSVT、TMM、TITS、TSTSP、TSMC、TBC、TGRS、TCI、MIS、TCDS、TETCI、TIV、PR和中国科学等国际权威SCI期刊或核心期刊上发表学术论文50多篇

成果资料

产业化落地方案

点击查看

成果综合评价报告

评价单位：- (-) 评价时间：2022-12-01

程红林

徐州工程学院信息工程学院

副教授

综合评价

该成果同时考率了横向与纵向，在增加模型深度的同时适当的横向拓宽，采用了一个输入经过多个不同的支路再汇集在一起，将不同的特征图进行拼接，融合了不同尺寸的特征，减少了参数，加快了模型的运算速度。采用了残差块跳跃连接，采集不同的特征图，重复利用低层特征图，其再与高层信息融合，使得图像信息更为全面，在训练和测试过程中，都得到了较好的验证。该项目技术思路方向很好，未来市场空间大，有利于当前政策要求，转化成熟度很高，值得支持推广。建议强化相应产品开发，加大产业链开发力度。

科创中国

友情链接

国际技术贸易

海外专利信息资源系统

省级中心站