机器人的动作空间是连续的高维空间,如果将策略直接表示为状态空间到力矩空间的映射,那么策略搜索会遇到维数灾难的问题。为了提升学习速度,减少学习时间,在实际的机器人运动学习中常常会根据学习的任务将专业知识和经验以特殊的方式耦合进策略的表示中。这种策略表示方式尽管降低了策略的表示能力,但往往能快速地进行学习,实现超越传统控制器的水平。
此文由 怡心湖 编辑,若您觉得有益,欢迎分享转发!:首页 > 常识论 » 机器人在实际应用中所需要注意的智能学习方法探讨
机器人的动作空间是连续的高维空间,如果将策略直接表示为状态空间到力矩空间的映射,那么策略搜索会遇到维数灾难的问题。为了提升学习速度,减少学习时间,在实际的机器人运动学习中常常会根据学习的任务将专业知识和经验以特殊的方式耦合进策略的表示中。这种策略表示方式尽管降低了策略的表示能力,但往往能快速地进行学习,实现超越传统控制器的水平。
此文由 怡心湖 编辑,若您觉得有益,欢迎分享转发!:首页 > 常识论 » 机器人在实际应用中所需要注意的智能学习方法探讨