دانلود مقاله انگلیسی رایگان:حداقل سازی همبستگی پاسخ در یادگیری تقویتی متفاوت موقت - 2020
دانلود بهترین مقالات isi همراه با ترجمه فارسی 2

با سلام خدمت کاربران در صورتی که با خطای سیستم پرداخت بانکی مواجه شدید از طریق کارت به کارت (6037997535328901 بانک ملی ناصر خنجری ) مقاله خود را دریافت کنید (تا مشکل رفع گردد). 

دانلود مقاله انگلیسی یادگیری تقویتی رایگان
  • Correlation minimizing replay memory in temporal-difference reinforcement learning Correlation minimizing replay memory in temporal-difference reinforcement learning
    Correlation minimizing replay memory in temporal-difference reinforcement learning

    دسته بندی:

    یادگیری تقویتی - Reinforcement-Learning


    سال انتشار:

    2020


    عنوان انگلیسی مقاله:

    Correlation minimizing replay memory in temporal-difference reinforcement learning


    ترجمه فارسی عنوان مقاله:

    حداقل سازی همبستگی پاسخ در یادگیری تقویتی متفاوت موقت


    منبع:

    Sciencedirect - Elsevier - Neurocomputing, 393 (2020) 91-100. doi:10.1016/j.neucom.2020.02.004


    نویسنده:

    Mirza Ramicic a , ∗, Andrea Bonarini b


    چکیده انگلیسی:

    Online reinforcement learning agents are now able to process an increasing amount of data which makes their approximation and compression into value functions a more demanding task. To improve approx- imation, thus the learning process itself, it has been proposed to select randomly a mini-batch of the past experiences that are stored in the replay memory buffer to be replayed at each learning step. In this work, we present an algorithm that classifies and samples the experiences into separate contextual memory buffers using an unsupervised learning technique. This allows each new experience to be as- sociated to a mini-batch of the past experiences that are not from the same contextual buffer as the current one, thus further reducing the correlation between experiences. Experimental results show that the correlation minimizing sampling improves over Q-learning algorithms with uniform sampling, and that a significant improvement can be observed when coupled with the sampling methods that prioritize on the experience temporal difference error.
    Keywords: Reinforcement learning | Temporal-difference learning | Replay memory | Artificial neural networks


    سطح: متوسط
    تعداد صفحات فایل pdf انگلیسی: 10
    حجم فایل: 1108 کیلوبایت

    قیمت: رایگان


    توضیحات اضافی:




اگر این مقاله را پسندیدید آن را در شبکه های اجتماعی به اشتراک بگذارید (برای به اشتراک گذاری بر روی ایکن های زیر کلیک کنید)

تعداد نظرات : 0

الزامی
الزامی
الزامی
rss مقالات ترجمه شده rss مقالات انگلیسی rss کتاب های انگلیسی rss مقالات آموزشی
logo-samandehi
بازدید امروز: 11564 :::::::: بازدید دیروز: 0 :::::::: بازدید کل: 11564 :::::::: افراد آنلاین: 67