“船海数据智能应用创新大赛” 选手对话,赋予目标识别一双“火眼金睛”

发布时间: 2022-07-19

图片

为了促进现代信息技术和新一代人工智能技术与船舶技术融合发展,深海技术科学太湖实验室(以下简称太湖实验室)联合无锡市委人才工作领导小组办公室、无锡市科学技术局、华为技术有限公司共同主办了首届“船海数据智能应用创新大赛”。

在初赛第一赛道“水面/水下典型目标识别”中,来自华中科技大学张钧杰团队、南京理工大学沈飞团队、浙江大学许可团队获得了前三名。

       赛题解提高典型目标检测识别能力

面向日益增长的智能化水上交通、海洋环境探测、水下探测等场景需求,提高水面/水下针对船只、渔网、浮标、漂浮物、礁石、水生物等典型目标的检测识别能力成为船舶领域人工智能应用亟需解决的难题。

       科研的道路不会一帆风顺

科研的道路上永远不会一帆风顺,在提交解决方案的过程中,三组参赛选手都或多或少的遇到了一些难题;而通过专业资料检索、选手平台交流,以及赛事主办方专业指引,最终都迎刃而解。

       张钧杰

       华中科技大学

张钧杰是华中科技大学研一学生,曾参加过目标检测相关的赛事,如城市红绿灯视觉检测与识别比赛、雨雪雾行驶场景下交通参与者视觉检测与识别以及阿里天池的小样本商标检测挑战赛。

对于初赛提交的方案,张钧杰用中规中矩来形容。训练阶段用的都是一些常见的数据增强手段,然后对学习率、优化器等参数进行精细调整。谈到比赛过程中的难点,他表示:“赛题中对于FPS的要求是一个比较难的点,这要求我们在精度与速度之间进行平衡。如何保证速度达标的情况下仍然能够展现出良好的性能是这个比赛的关键所在。”

       沈飞

       南京理工大学

沈飞主攻人工智能目标检测方向。在比赛过程中,他们遇到了两个比较大的挑战:第一个挑战是来自数据,如:背景复杂导致的目标物体虚化、光照和角度变化、样本稀少不均衡、样本标注误差较大等问题。针对数据问题,团队使用了丰富的数据增强技术、中值滤波进行噪声抑制、mixup混合图像增加抗拟合性以及图卷积来增强局部特征提取能力。

第二个挑战是来自比赛限时30FPS,让他们面临速度和精度的平衡挑战。初赛的模型暂时能满足要求,后续会考虑使用知识蒸馏、模型剪枝量化、TensorRT等技术进行模型加速。

       许可

       浙江大学

在初赛中,许可介绍说,团队主要用的都是很成熟的技术,其中有4点提分比较高。

一是多尺度训练和测试时增强(tta),多尺度训练能让模型适应不同尺寸的目标,而tta对于一张测试图像,将不同尺度下所得到的bbox放在一起做nms,能够有效提高mAP。

二是multi-lable,因为他们观察到很多船只十分的模糊,人眼都无法分辩。

三是merge-nms,对于置信度比较低的bbox,不直接删除,而是通过iou对最终的bbox坐标进行加权,这是针对数据集中bbox的标注不够精确,并且计算量也不大。

四是Swa(模型参数平均), 能让模型更具泛化性,有着ensemble的效果但不增加计算量。

       排行榜实时刷新 公开透明

张钧杰对此次参赛感受比较深刻的有两点:一是排行榜实时刷新,比赛更透明,也让选手更有冲劲;二是这次比赛因为对速度有要求,所以对于显卡的要求不是很高,用的baseline也是比较熟悉的yolov5,三是智慧船海的应用背景,使这个比赛也非常具有实际意义。

       科研立项是比赛最大的奖励

比赛很透明,公平性好,而且影响力大。此外,这个比赛最特殊、也是吸引沈飞的地方就是“科研立项”——太湖实验室给出了按照国家自然科学基金重大项目立项标准,为获奖团队在赛题方向提供不少于100万元科研立项支持!

       促进传统方法到深度学习的跨越

初赛第三名来自浙江大学的许可曾参加过诸如图像分析类竞赛,但是目标检测类的还是首次。作为人工智能专业日常主要学习传统视觉优化。此次参赛,团队不仅冲着大赛诱人的奖金,也是想借着比赛实现从传统方法到深度学习的跨越,达到以赛促学的目的。

       营造创新生态  带动产业发展

“未来我们将致力于营造船海和数字化结合的创新生态环境、搭建鼓励更多科技人才参与交流的平台,并带动上下游产业链的协同发展。”本次赛事不仅吸引了众多科技人才的参与、带动相关产业发展,太湖实验室也希望以此为起点,营造创新生态环境、孵化更多智能应用项目,进一步促进我国船海探索软硬件的不断升级。

太湖实验室与华为在各自专业领域的“强强联手”,也将推动更多科技研究成果转化为船海中的实际应用,为走向深远海、建设海洋强国的国家战略需求进一步助力。

       来源:深海技术科学太湖实验室