دانلود مقاله انگلیسی رایگان:کنترل ردیابی بهینه مبتنی بر شبکه های عصبی برای بازی های جمع غیر صفر سیستم های غیرخطی مداوم چند نفره از طریق یادگیری تقویتی - 2020
دانلود بهترین مقالات isi همراه با ترجمه فارسی
دانلود مقاله انگلیسی یادگیری تقویتی رایگان
  • Neural networks-based optimal tracking control for nonzero-sum games of multi-player continuous-time nonlinear systems via reinforcement learning Neural networks-based optimal tracking control for nonzero-sum games of multi-player continuous-time nonlinear systems via reinforcement learning
    Neural networks-based optimal tracking control for nonzero-sum games of multi-player continuous-time nonlinear systems via reinforcement learning

    سال انتشار:

    2020


    عنوان انگلیسی مقاله:

    Neural networks-based optimal tracking control for nonzero-sum games of multi-player continuous-time nonlinear systems via reinforcement learning


    ترجمه فارسی عنوان مقاله:

    کنترل ردیابی بهینه مبتنی بر شبکه های عصبی برای بازی های جمع غیر صفر سیستم های غیرخطی مداوم چند نفره از طریق یادگیری تقویتی


    منبع:

    Sciencedirect - Elsevier - Neurocomputing, 412 (2020) 167-176. doi:10.1016/j.neucom.2020.06.083


    نویسنده:

    Jingang Zhao


    چکیده انگلیسی:

    In this paper, optimal tracking control for nonzero-sum games of multi-player continuous-time nonlinear systems is investigated by using a novel reinforcement learning scheme. Based on the multi-player nonlinear systems and reference signal, we firstly formulate the tracking problem by constructing an augmented multi-player nonlinear systems. The optimal tracking control problem for nonzero-sum games of original multi-player nonlinear systems is thus transformed into solving the coupled Hamilton– Jacobi equations of the augmented multi-player nonlinear systems. The novel neural networks (NNs) – based online reinforcement learning (RL) method can learn the solution to coupled Hamilton–Jacobi equations in a forward-in-time manner without requiring any value, policy iterations. In order to relax the dependence of the traditional reinforcement learning method on Persistence of Excitation (PE) conditions, historical data from a period of time has been collected to design NNs tuning laws. The drift dynamic of the augmented system is not required in our scheme. The Uniformly Ultimately Boundedness (UUB) of NNs weight errors and closed-loop augmented system states are rigorous proved. Numerical simulation examples are given to demonstrate the effectiveness of our proposed scheme.
    Keywords: Neural networks | Multi-player nonzero-sum game | Optimal tracking control | Continuous-time nonlinear systems | Coupled Hamilton–Jacobi equations | Reinforcement learning


    سطح: متوسط
    تعداد صفحات فایل pdf انگلیسی: 10
    حجم فایل: 815 کیلوبایت

    قیمت: رایگان


    توضیحات اضافی:




اگر این مقاله را پسندیدید آن را در شبکه های اجتماعی به اشتراک بگذارید (برای به اشتراک گذاری بر روی ایکن های زیر کلیک کنید)

تعداد نظرات : 0

الزامی
الزامی
الزامی
rss مقالات ترجمه شده rss مقالات انگلیسی rss کتاب های انگلیسی rss مقالات آموزشی
logo-samandehi