成果介绍
本项目针对无人机视频在复杂场景下的动态目标检测与跟踪定位需求,提出了一种联合实景三维模型的无人机视频目标检测与跟踪定位方法。针对传统方法在小目标检测精度低、复杂环境下跟踪鲁棒性不足的问题,项目改进了YOLOv5算法,引入小目标检测层和RepLK大卷积模块,提升小目标识别能力;优化ViBe算法,通过背景初始化和自适应阈值处理,增强复杂场景下的目标检测效果;采用平方根卡尔曼滤波改进OC-SORT算法,提升目标跟踪的数值稳定性和鲁棒性。结合实景三维模型约束,实现亚米级精度的三维目标定位。项目在VisDrone数据集上验证,检测精度和跟踪稳定性显著提升,实验表明帧率超30 FPS,具备高效性和实用性,已在城市监控、基建监测等领域展现应用潜力。项目成果申请多项专利,技术成熟度达成果级,适合技术转让或合作开发。
成果亮点
本项目突破了无人机视频动态目标检测与跟踪定位的瓶颈,提出联合实景三维模型的创新方法,显著提升复杂场景下小目标检测与跟踪精度。技术亮点包括:改进YOLOv5算法:新增小目标检测层和RepLK模块,显著提升小目标识别精度,在VisDrone-DET2019数据集上表现优异。优化ViBe算法:通过背景初始化和自适应阈值处理,提升复杂场景下目标检测鲁棒性,补充YOLO算法的检测不足。平方根卡尔曼滤波OC-SORT:增强跟踪算法的数值稳定性,适应遮挡和非线性运动场景,保持目标ID一致性。实景三维模型约束:结合光线追踪定位技术,实现亚米级三维定位精度,适用于城市监控、基建等场景。 项目成果在VisDrone-MOT2019数据集上验证,帧率超30 FPS,兼具高效性和实用性,申请多项专利,具备自主可控性和广阔推广前景。
团队介绍
孟小亮:武汉大学珞珈特聘教授,武汉大学工创中心主任,主持多项国家自然科学基金、国家重点研发计划、国家重大专项等国家级科研项目与课题,指导中国国家大学生创新大赛多个金奖项目,荣膺中国地理信息科技进步一等奖、荣膺国际摄影测量与遥感协会(ISPRS)最佳青年作者奖等重要奖项。马焱苧:硕士,孟小亮教授学生。严培辉:武汉大学工创中心实验工程师,发表高水平SCI论文15篇,专利12项,软件著作6项,指导学生竞赛获得国家一等奖3项。张祖勋:团队顾问,中国工程院院士。龚健雅:团队顾问,中国科学院院士。
成果资料