怡心湖

迁移学习最新进展之迁移强化学习和终身迁移学习简介

迁移强化学习

自从Alphago风靡全球以来,强化学习就成为了人工智能领域炙手可热的研究方向。然而,AlphaGo虽然功能强大,但是其仅适用于围棋这专门领域,甚至我们只需把围棋的棋盘从19×19改成21×21,就能使它的现有算法失效。因此,研究者们开始思考,如何利用已经学到的知识,来帮助它学习更多的其他相似任务?这就是迁移强化学习(transfer reinforcement learning)。迁移强化学习指的是把迁移学习的技术应用到强化学习的智能体训练过程中。强化学习本质上是一种学习从环境到决策的映射从而使效益最大化的方法。目前,强化学习的研究面临着多重挑战,如难以从环境中获取足够反馈,以及面对复杂任务或多项任务时的糟糕表现。而迁移强化学习从源任务选择、知识迁移、任务映射等多个角度对解决这些问题产生了至关重要的影响。

此文由 怡心湖 编辑,若您觉得有益,欢迎分享转发!:首页 > 常识论 » 迁移学习最新进展之迁移强化学习和终身迁移学习简介

()
分享到:

相关推荐