با سلام خدمت کاربران در صورتی که با خطای سیستم پرداخت بانکی مواجه شدید از طریق کارت به کارت (6037997535328901 بانک ملی ناصر خنجری ) مقاله خود را دریافت کنید (تا مشکل رفع گردد).
ردیف | عنوان | نوع |
---|---|---|
1 |
Behavior fusion for deep reinforcement learning
همجوشی رفتار برای یادگیری تقویت عمیق-2020 For deep reinforcement learning (DRL) system, it is difficult to design a reward function for complex
tasks, so this paper proposes a framework of behavior fusion for the actor–critic architecture, which
learns the policy based on an advantage function that consists of two value functions. Firstly, the
proposed method decomposes a complex task into several sub-tasks, and merges the trained policies
for those sub-tasks into a unified policy for the complex task, instead of designing a new reward
function and training for the policy. Each sub-task is trained individually by an actor–critic algorithm
using a simple reward function. These pre-trained sub-tasks are building blocks that are used to
rapidly assemble a rapid prototype of a complicated task. Secondly, the proposed method integrates
modules in the calculation of the policy gradient by calculating the accumulated returns to reduce
variation. Thirdly, two alternative methods to acquire integrated returns for the complicated task are
also proposed. The Atari 2600 pong game and a wafer probe task are used to validate the performance
of the proposed methods by comparison with the method using a gate network. Keywords: Deep reinforcement learning | Actor–critic | Policy gradient | Behavior fusion | Complex task |
مقاله انگلیسی |
2 |
روش مدلسازی پس زمینه براساس درخت تجزیه چهارگانه و اندازه گیری شدت روشنایی
سال انتشار: 2019 - تعداد صفحات فایل pdf انگلیسی: 8 - تعداد صفحات فایل doc فارسی: 14 تشخیص حرکت یک کار پیچیده است که بر طیف وسیعی از اجزای اساسی ایجاد می شود. به منظور اطمینان از تشخیص دقیق جسم، لازم است که این اجزاء به دقت ، به ویژه در حضور اجسام پیچیده در صحنه اجرا شود. این مقاله ، روش مدل سازی Background مبتنی بر بلوک در صحنه های پویا را با استفاده از تجزیه درخت چهارگانه و سنجش تباین ارائه می دهد. نتایج تجربی نشان داد که رویکرد ما میتواند بک گراندی موثر حتی تحت شرایط چالش برانگیز ایجاد کند.
کليدواژه: نظارت تصویری | مدل سازی پس زمینه | روش مبتنی بر ناحیه | تجزیه چهارگانه؛ |
مقاله ترجمه شده |