成果介绍
本技术成果提出了一种三维视觉目标检测与识别方法。在三维视觉目标检测方面,提出了一种基于关系推理网络的单目三维物体检测方法,方法流程图如图2所示。方法提出了一种新的单目三维物体检测架构,训练了一个深度关系推理网络来估计三维候选和真实物体之间的空间位置关系,通过测量投影结果和真实物体之间的视觉拟合度来实现高精的三维空间定位。
在三维视觉目标识别方法,提出了一种基于球面分形卷积神经网络的三维点云识别技术,方法流程图如图3所示。方法通过引入球面分形结构,将原始三维点云通过可学习的神经网络投影到球面,使得卷积神经网络可以高效处理三维点云数据并进行特征特征,同时通过设计基于分形结构的层次化学习框架,提高了三维点云物体识别的精度,实现了对于三维点云目标在旋转条件下特征表示的鲁棒性。
成果亮点
在自动驾驶应用中,相比于使用昂贵的激光雷达等传感器,相机传感器成本低廉,且寿命长、易于安装,同时图像的检测技术相对更加成熟,有利于研究工作的快速进行。难点在于单目三维物体检测的问题设置下,唯一的线索只有二维图像中的外观信息,而真实的三维信息却无法获取。本方法使用一种基于锚点的方法来回归出物体的尺寸和朝向信息,并构建出三维候选,然后根据相机投影关系将候选投影到图片上,并利用一个拟合程度网络来推理这些三维候选和物体之间的三维覆盖率,显著提高了三维检测算法的定位精度。
团队介绍
本项目由清华大学自动化系智能视觉实验室完成,团队成员包含国家杰出青年科学基金获得者2人,国家优秀青年科学基金获得者2人,IAPR Fellow 2人在计算机视觉领域有着长期深入的技术积累,在PAMI/IJCV/CVPR/ICCV/ECCV上共发表论文120余篇,主持承担国家自然科学基金委重大国际合作项目、联合重点基金、国家重点研发计划课题等项目,以第一完成人获国家技术发明二等奖、中国电子学会自然科学一等奖等科技奖励,多项技术在多家公司实现了技术转化。
成果资料