您所在的位置: 成果库 一种基于残差网络及局部细化的单目深度估计方法

一种基于残差网络及局部细化的单目深度估计方法

发布时间: 2022-11-09

来源: 科技服务团

基本信息

合作方式: 技术许可
成果类型: 发明专利
行业领域:
电子信息技术
成果介绍
本发明公开了一种基于残差网络及局部细化的单目深度估计方法。在训练阶段,搭建神经网络模型,其隐藏层主要包括5个部分,即inception部分、编码部分、解码部分、跳跃连接部分、以及局部细化部分;使用最初的、原始的KITTI数据库交通场景图,将其进行处理、归一化,再输入到神经网络模型中进行反复的训练,得到的深度图再与相应的标签图进行对应损失函数值的计算,得到最优权重;在测试阶段,将待测试的交通场景图输入到神经网络模型当中,并载入训练阶段的最优权重,输出标签接近的深度图,优点是提高了KITTI数据图片单目深度预测的准确性,提升了深度图的质量。
成果亮点
隐藏层的分支部分包括第一分支部分和第二分支部分,第一分支部分包括依次连接的第二个初始卷积块、第三个初始卷积块、第四个初始卷积块、第五个初始卷积块、第六个初始卷积块和第七个初始卷积块,第二个初始卷积块与输入层连接,第二个初始卷积块接收输入层的输出,第七个初始卷积块连接到第一个初始上采样残差块的输出端,第一个初始上采样残差块的输出与第七个初始卷积块的输出通过Add叠加的方式融合后再输入到第一个Dropout层。 隐藏层的第二分支部分包括第一个恒等跳跃块、第二个恒等跳跃块、第三个恒等跳跃块、第四个恒等跳跃块,第一个恒等跳跃块的输入连接到第三个下采样块的输出,第一个恒等跳跃块的输出连接到第二个上采样块的输入,第一个上采样块的输出和第一个恒等跳跃块的输出通过Add叠加的方式融合后再输入到第二个上采样块。 第二个恒等跳跃块的输入连接到第二个下采样块的输出,第二个恒等跳跃块的输出连接到第三个上采样块的输入,第二个上采样块的输出和第二个恒等跳跃块的输出通过Add叠加的方式融合后作为第三个上采样块的输入。
团队介绍
周武杰,1983年9月出生,副教授/博士后,硕士生导师,浙江省电子学会理事,IEEE成员,CCF成员,中国人工智能学会会员,浙江省“计算机科学与技术”一流学科B类方向负责人。2012年入选"青年骨干教师",2015年入选"优秀青年教师资助计划",2016年入选"科大青年英才",2022年入选斯坦福大学发布的全球前2%顶尖科学家榜单。浙江大学信息与通信工程专业博士后,国家留学基金委公派新加坡南洋理工大学访问学者。主要从事人工智能与深度学习、机器视觉与模式识别、图像处理等方面的研究;近几年以第一作者在AAAI、TIP、TNNLS、TCSVT、TMM、TITS、TSTSP、TSMC、TBC、TGRS、TCI、MIS、TCDS、TETCI、TIV、PR和中国科学等国际权威SCI期刊或核心期刊上发表学术论文50多篇
成果资料
产业化落地方案
点击查看
成果综合评价报告

评价单位:- (-) 评价时间:2022-12-01

程红林

徐州工程学院信息工程学院

副教授

综合评价

该成果同时考率了横向与纵向,在增加模型深度的同时适当的横向拓宽,采用了一个输入经过多个不同的支路再汇集在一起,将不同的特征图进行拼接,融合了不同尺寸的特征,减少了参数,加快了模型的运算速度。采用了残差块跳跃连接,采集不同的特征图,重复利用低层特征图,其再与高层信息融合,使得图像信息更为全面,在训练和测试过程中,都得到了较好的验证。该项目技术思路方向很好,未来市场空间大,有利于当前政策要求,转化成熟度很高,值得支持推广。建议强化相应产品开发,加大产业链开发力度。
查看更多>
更多