دانلود مقاله انگلیسی رایگان:همجوشی رفتار برای یادگیری تقویت عمیق - 2020
بلافاصله پس از پرداخت دانلود کنید

با سلام خدمت کاربران در صورتی که با خطای سیستم پرداخت بانکی مواجه شدید از طریق کارت به کارت (6037997535328901 بانک ملی ناصر خنجری ) مقاله خود را دریافت کنید (تا مشکل رفع گردد). 

دانلود مقاله انگلیسی یادگیری تقویتی رایگان
  • Behavior fusion for deep reinforcement learning Behavior fusion for deep reinforcement learning
    Behavior fusion for deep reinforcement learning

    دسته بندی:

    یادگیری تقویتی - Reinforcement-Learning


    سال انتشار:

    2020


    عنوان انگلیسی مقاله:

    Behavior fusion for deep reinforcement learning


    ترجمه فارسی عنوان مقاله:

    همجوشی رفتار برای یادگیری تقویت عمیق


    منبع:

    Sciencedirect - Elsevier - ISA Transactions, 98 (2020) 434-444. doi:10.1016/j.isatra.2019.08.054


    نویسنده:

    Haobin Shi a, Meng Xu a, Kao-Shing Hwang b,∗,1, Bo-Yin Cai b


    چکیده انگلیسی:

    For deep reinforcement learning (DRL) system, it is difficult to design a reward function for complex tasks, so this paper proposes a framework of behavior fusion for the actor–critic architecture, which learns the policy based on an advantage function that consists of two value functions. Firstly, the proposed method decomposes a complex task into several sub-tasks, and merges the trained policies for those sub-tasks into a unified policy for the complex task, instead of designing a new reward function and training for the policy. Each sub-task is trained individually by an actor–critic algorithm using a simple reward function. These pre-trained sub-tasks are building blocks that are used to rapidly assemble a rapid prototype of a complicated task. Secondly, the proposed method integrates modules in the calculation of the policy gradient by calculating the accumulated returns to reduce variation. Thirdly, two alternative methods to acquire integrated returns for the complicated task are also proposed. The Atari 2600 pong game and a wafer probe task are used to validate the performance of the proposed methods by comparison with the method using a gate network.
    Keywords: Deep reinforcement learning | Actor–critic | Policy gradient | Behavior fusion | Complex task


    سطح: متوسط
    تعداد صفحات فایل pdf انگلیسی: 11
    حجم فایل: 1133 کیلوبایت

    قیمت: رایگان


    توضیحات اضافی:




اگر این مقاله را پسندیدید آن را در شبکه های اجتماعی به اشتراک بگذارید (برای به اشتراک گذاری بر روی ایکن های زیر کلیک کنید)

تعداد نظرات : 0

الزامی
الزامی
الزامی
rss مقالات ترجمه شده rss مقالات انگلیسی rss کتاب های انگلیسی rss مقالات آموزشی
logo-samandehi
بازدید امروز: 1496 :::::::: بازدید دیروز: 0 :::::::: بازدید کل: 1496 :::::::: افراد آنلاین: 51