دانلود و نمایش مقالات مرتبط با Multiagent Systems::صفحه 1
بلافاصله پس از پرداخت دانلود کنید

با سلام خدمت کاربران در صورتی که با خطای سیستم پرداخت بانکی مواجه شدید از طریق کارت به کارت (6037997535328901 بانک ملی ناصر خنجری ) مقاله خود را دریافت کنید (تا مشکل رفع گردد). 

نتیجه جستجو - Multiagent Systems

تعداد مقالات یافته شده: 4
ردیف عنوان نوع
1 PALO Bounds for Reinforcement Learning in Partially Observable Stochastic Games
مرزهای PALO برای یادگیری تقویتی در بازی های تصادفی تا حدی قابل مشاهده-2020
A partially observable stochastic game (POSG) is a general model for multiagent de- cision making under uncertainty. Perkins’ Monte Carlo exploring starts for partially observable Markov decision process (POMDP) (MCES-P) integrates Monte Carlo ex- ploring starts (MCES) into a local search of the policy space to offer an elegant template for model-free reinforcement learning in POSGs. However, multiagent reinforcement learning in POSGs is tremendously more complex than in single agent settings due to the heterogeneity of agents and discrepancy of their goals. In this article, we generalize reinforcement learning under partial observability to self-interested and cooperative multiagent settings under the POSG umbrella. We present three new templates for multiagent reinforcement learning in POSGs. MCES for interactive POMDP (MCESIP ) extends MCES-P by maintaining predictions of the other agent’s actions based on dynamic beliefs over models. MCES for multiagent POMDP (MCES-MP) generalizes MCES-P to the canonical multiagent POMDP framework, with a single policy mapping joint observations of all agents to joint actions. Finally, MCES for factored-reward multiagent POMDP (MCES-FMP) has each agent individually mapping joint obser- vations to their own action. We use probabilistic approximate locally optimal (PALO) bounds to analyze sample complexity, thereby instantiating these templates to PALO learning. We promote sample efficiency by including a policy space pruning technique and evaluate the approaches on six benchmark domains as well as compare with the state-of-the-art techniques, which demonstrates that MCES-IP and MCES-FMP yield improved policies with fewer samples compared to the previous baselines.
Keywords: multiagent systems | reinforcement learning | POMDP | POSG
مقاله انگلیسی
2 The dynamics of reinforcement social learning in networked cooperative multiagent systems
پویایی یادگیری اجتماعی تقویت در سیستم های چندگانه تعاونی شبکه ای-2017
Multiagent coordination in cooperative multiagent systems, as one of the fundamental problems in multiagent systems, and has been widely studied in the literature. In real environments, the interactions among agents are usually sparse and regulated by their underlying network structure, which, however, has received relatively few attentions in previous work. To this end, we firstly systematically investigate the multiagent coordination problems in cooperative environments under the networked social learning framework under four representa tive topologies. A networked social learning framework consists of a population of agents where each agent interacts with another agent randomly selected from its neighborhood in each round. Each agent updates its learning policy through repeated interactions with its neighbors via both individual learning and social learning. It is not clear a priori whether all agents are able to learn towards a consistent optimal coordination policy. Two types of learners are proposed: individual action learner and joint action learner. We evaluate the learning performances of both learners extensively in different cooperative (both single-stage and Markov) games. Besides, the influence of different factors (network topologies, different types of games, different topology parameters) is investigated and analyzed and new insights are obtained.
Keywords: Multiagent social learning | Multiagent coordination | Cooperative games
مقاله انگلیسی
3 طراحی و ارزیابی الگوریتم های یادگیری برای مدیریت دینامیک منابع در شبکه های مجازی
سال انتشار: 2014 - تعداد صفحات فایل pdf انگلیسی: 9 - تعداد صفحات فایل doc فارسی: 35
مجازی سازی شبکه بعنوان راه حلی برای قالب بندی-تقویت ساختار اینترنت، توجه زیادی را بخود جلب نموده است. اگرچه، بخشی از موفقیت مجازی سازی شبکه بستگی به این خواهد داشت که تا چه اندازه شبکه های مجازی از منابع فرعی شبکه بطرز موثری استفاده می کنند. در این مقاله، رویکرد مبتنی بر یادگیری ماشین برای مدیریت منابع شبکه مجازی پیشنهاد می شود. ما پیشنهاد می کنیم تا شبکه فرعی بصورت سیستم غیرمتمرکز مدل سازی شود و الگوریتم یادگیری را در هر گره فرعی و لینک فرعی معرفی می کنیم، که سبب ایجاد توانایی های خودسازماندهی می شود. همچنین الگوریتم یادگیری چندعاملی را پیشنهاد می کنیم که مدیریت منابع شبکه فرعی را به روش هماهنگ و غیرمتمرکز انجام می دهد. وظیفه این عامل ها (نماینده ها) استفاده از فیدبک تخمینی برای یادگیری ترفندی بهینه است تا بصورت دینامیک منابع شبکه را به گره ها و لینک های مجازی اختصاص دهند. عامل ها اطمینان می دهند که درحین اینکه شبکه های مجازی دارای منابعی هستند که در زمان های معین به ان ها نیاز دارند، تنها منابع مورد نیاز برای این منظور ذخیره می شوند. نتایج شبیه سازی ها نشان می دهند که روش دینامیکی ما، بطور قابل توجهی نرخ پذیرش شبکه مجازی و حداکثر تعداد درخواست های مورد قبول شبکه مجازی را در هر زمان بهبود می دهد حال انکه اطمینان می-دهد کیفیت نیازهای خدماتی شبکه مجازی مانند نرخ رهاسازی بسته و تاخیر لینک مجازی تحت تاثیر قرار نمی گیرند.
کلمات کلیدی: مجازی سازی شبکه | تخصیص دینامیک منابع | تعبیه شبکه مجازی | هوش مصنوعی | یادگیری ماشین | یادگیری تقویت | سیستم های چند عاملی
مقاله ترجمه شده
4 مدیریت انرژی در ریز شبکه ها با استفاده از پاسخ به تقاضا و ذخیره سازی توزیع شده- رویکرد چند عاملی
سال انتشار: 2013 - تعداد صفحات فایل pdf انگلیسی: 9 - تعداد صفحات فایل doc فارسی: 23
در این مقاله، یک سیستم مدیریت انرژی مبتنی بر عامل به منظور تسهیل مبادله نیرو میان شبکه های ریز با پاسخ به تقاضا و شبکه های توزیع (DRaDS) پیشنهاد شده است. تمرکز اصلی این رویکرد استفاده از تنوع در الگوی مصرف بار مشتریان و در دسترس بودن انرژی از منابع انرژی توزیع شده و شبکه توزیع و پاسخ تقاضا (DR) در کاهش تقاضای اوج و به حداقل رساندن هزینه های برق است. مکانیزم های تشویقی مبتنی بر شاخص همچنین به منظور تشویق مشتریان شرکت بر اساس فرکانس و اندازه مشارکت پیشنهاد شده است. استراتژی های پیشنهادی با استفاده از دو مطالعه موردی با ارتباط تنگاتنگ شبکه های ریز معتبر می باشند. بر اساس نتایج شبیه سازی گسترده ای از سیستم با استفاده از چارچوب توسعه عامل جاوا (JADE) در حال توسعه، مشخص شده است که مدیریت انرژی مبتنی بر شبکه های ریز با DRaDS در کاهش اوج سیستم و سود برای مشتریان با اولویت های شاخص هزینه بالا موفق شده است.
عبارات نمایه: پاسخ تقاضا | مدیریت سمت تقاضا | ذخیره سازی توزیع شده | شبیه سازی بازارهای انرژی | ریز شبکه ها و سامانه چندعاملی
مقاله ترجمه شده
rss مقالات ترجمه شده rss مقالات انگلیسی rss کتاب های انگلیسی rss مقالات آموزشی
logo-samandehi
بازدید امروز: 9027 :::::::: بازدید دیروز: 0 :::::::: بازدید کل: 9027 :::::::: افراد آنلاین: 75