基于模仿与强化学习的医药机器人自主避障方法及系统

发布时间: 2022-11-14

来源: 科技服务团

基本信息

合作方式：委托开发

成果类型：发明专利

行业领域：

新一代信息技术产业,人工智能

成果介绍

本发明公开了一种基于模仿与强化学习的医药机器人自主避障方法及系统，该方法包括：步骤1：设置医药机器人医药搬运场景；步骤2：获取专家演示二元组数据；步骤3：构建基于模仿学习和强化学习的医药机器人移动控制模型；步骤4：模型训练；步骤5：对医药机器人进行自主控制。本发明在医药机器人移动控制模型中将图注意模块引入价值网络中，使能够适应智能体和障碍物数量不确定的不同环境，同时，区分了医药机器人可观测范围内不同智能体和障碍物对移医药机器人的影响，使其能够更好地做出决策。只需一组网络参数就可以适用于处理各种情况，即网络具有较好的泛化性。

成果亮点

"相较于现有技术而言，本方案存在以下几点优点： 1、将图注意模块引入价值网络中，使能够适应智能体和障碍物数量不确定的不同环境，同时，区分了医药机器人可观测范围内不同智能体和障碍物对医药机器人的影响，使其能够更好地做出决策。与针对具有不同数量智能体和障碍物的新环境进行再训练不同，只需一组网络参数就可以适用于处理各种情况，即网络具有较好的泛化性。 2、采用模仿学习和强化学习相结合的方法，解决了强化学习中动作策略探索空间大，奖励稀疏、延迟回报的问题。 3、利用最优互补避碰策略获得大量的演示经验，更好的解决了模仿学习中专家演示数据集难以获取的问题。"

团队介绍

"张辉：湖南大学机器人学院教授，博士生导师，湖南大学机器人视觉感知与控制技术国家工程研究中心副主任。2022年湖南省科技创新领军人才，湖南省杰出青年基金获得者，首届湖南省“湖湘青年英才”。负责对项目的总体方案规划选型，核心指标设定，项目进度以及实施方案，以及学生管理工作。王可：硕士研究生，主要研究方向为高光谱图像异常检测、工业缺陷检测、多机器人避障。负责对项目的机器人避障方案的设计、调试。"

成果资料

产业化落地方案

点击查看

成果综合评价报告

评价单位：“科创中国”机器视觉与智能产业科技服务团 (中国图象图形学学会) 评价时间：2022-11-15

江一鸣

湖南大学

副教授

综合评价

该项目科技成果将图注意模块引入价值网络中，使能够适应智能体和障碍物数量不确定的不同环境，利用的方法和框架较为新颖，创新水平较高，市场前景较好，在公共管理服务、防疫工作等方面都能够实现较好的应用扩展。同时，项目已经配合企业完成使用性开发，能够较快的完成技术成果转换，产业化路径明确，目前技术方案较为完整，开发条件较为成熟，投资风险较小，并能够获得较好的回报。其与企业完成的部署方案是项目的一大亮点，解决了行业领域的核心痛点。总体而言，该项目技术思路方向很好，未来市场空间大，有利于当前政策要求，转化成熟度很高，值得支持推广。

科创中国

友情链接

国际技术贸易

海外专利信息资源系统

省级中心站