دانلود مقاله انگلیسی رایگان:یک روش گروهی برای یادگیری تقویتی معکوس - 2020
بلافاصله پس از پرداخت دانلود کنید
دانلود مقاله انگلیسی یادگیری تقویتی رایگان
  • An ensemble method for inverse reinforcement learning An ensemble method for inverse reinforcement learning
    An ensemble method for inverse reinforcement learning

    سال انتشار:

    2020


    عنوان انگلیسی مقاله:

    An ensemble method for inverse reinforcement learning


    ترجمه فارسی عنوان مقاله:

    یک روش گروهی برای یادگیری تقویتی معکوس


    منبع:

    Sciencedirect - Elsevier - Information Sciences, 512 (2020) 518-532. doi:10.1016/j.ins.2019.09.066


    نویسنده:

    Jin-Ling Lin a , Kao-Shing Hwang b , ∗, Haobin Shi c , Wei Pan c


    چکیده انگلیسی:

    In inverse reinforcement learning (IRL), a reward function is learnt to generalize experts’ behavior. This paper proposes a model-free IRL algorithm based on an ensemble method, where the reward function is regarded as a parametric function of expected features. In other words, the parameters are updated based on a weak classification method. The IRL is formulated as a problem of a boosting classifier, akin to the renowned Adaboost algorithm for classification, feature expectations from experts’ demonstration, and the trajectory induced by an agent’s current policy. The proposed approach takes individual feature expectation as attractor or expeller, depending on the sign of the residuals of the state trajectories between expert’s demonstration and the one induced by RL with the currently approximated reward function, so as to tackle its central challenges of accurate inference, generalizability, and correctness of prior knowledge. Then, the proposed method is applied further to approximate an abstract reward function from observations of more complex behavior composed of several basic actions. The results of the simulations in a labyrinth are shown to validate the proposed algorithm. Furthermore, behaviors composed of a set of primitive actions on a soccer robot field are examined for the applicability of the proposed method.
    Keywords: Apprentice learning | Inverse reinforcement learning | Q-learning | Boosting classifier


    سطح: متوسط
    تعداد صفحات فایل pdf انگلیسی: 15
    حجم فایل: 1825 کیلوبایت

    قیمت: رایگان


    توضیحات اضافی:




اگر این مقاله را پسندیدید آن را در شبکه های اجتماعی به اشتراک بگذارید (برای به اشتراک گذاری بر روی ایکن های زیر کلیک کنید)

تعداد نظرات : 0

الزامی
الزامی
الزامی
rss مقالات ترجمه شده rss مقالات انگلیسی rss کتاب های انگلیسی rss مقالات آموزشی
logo-samandehi