با سلام خدمت کاربران در صورتی که با خطای سیستم پرداخت بانکی مواجه شدید از طریق کارت به کارت (6037997535328901 بانک ملی ناصر خنجری ) مقاله خود را دریافت کنید (تا مشکل رفع گردد).
ردیف | عنوان | نوع |
---|---|---|
1 |
Troodon: A machine-learning based load-balancing application scheduler for CPU–GPU system
Troodon: یک برنامه زمانبندی برنامه تعادل بار بر مبنای یادگیری ماشین برای سیستم CPU-GPU-2019 Heterogeneous computing machines consisting of a CPU and one or more GPUs are increasingly being
used today because of their higher performance-cost ratio and lower energy consumption. To program
such heterogeneous systems, OpenCL has become an industry standard due to the portability across
various computing architectures. To exploit the computing capabilities of heterogeneous systems, application
developers are porting their cluster and Cloud applications using OpenCL. With the increasing
number of such applications, the use of shared accelerating computing devices (such as CPUs and
GPUs) should be managed using an efficient load-balancing scheduling heuristic capable of reducing
execution time, increasing throughput with high device utilization. Mostly, the OpenCL applications
are suited (execute faster) on a specific computing device (CPU or GPU) and with varying data-sizes
the speedup obtained by an application on the suitable device varies too. Applications’ mapping
to computing devices without considering device suitability and obtainable speedup on a suitable
device leads to sub-optimal execution time, lower throughput and load imbalance. Therefore, an
application scheduler should consider both the device-suitability and speedup variation for scheduling
decisions leading to a reduction in execution time and an increase in throughput. In this paper,
we present a novel load-balancing scheduling heuristic named as Troodon that considers machinelearning
based device-suitability model that classify OpenCL applications into either CPU suitable
or GPU suitable. Moreover, a speedup predictor that predicts the amount of speedup that jobs
will obtain when executed on a suitable device is also part of the Troodon. Troodon incorporates
the E-OSched scheduling mechanism to map jobs on CPU and GPUs in a load balanced way. This
results in reduced applications execution time, increased system throughput, and improved device
utilization. We evaluate the proposed scheduler using a large number of data-parallel applications
and compared with several other state-of-the-art scheduling heuristics. The experimental evaluation
has demonstrated that the proposed scheduler outperformed the existing heuristics and reduced the
application execution time up to 38% with increased system throughput and device utilization. Keywords: Heterogeneous system | Scheduling | Device suitability | Load-balancing | Machine learning |
مقاله انگلیسی |
2 |
راهکار آگاه از سود و Multi-QoS محدود برای جریان های کاری همزمان در سیستم های ناهمگون
سال انتشار: 2017 - تعداد صفحات فایل pdf انگلیسی: 11 - تعداد صفحات فایل doc فارسی: 32 اجرای یک اپلیکیشن می تواند باعث عدم تعادل جریان کاری یا workload در بین پردازنده های متناظر شود. که در نهایت منجر به هدردهی منابع و هزینه ی بیشتر می شود. در این مقاله یک سیستم مدیریت منابع پویا ارائه می دهیم که در آن پردازنده ها نه برای کار ها بلکه برای زیرمجموعه ای از آنها به نام task استفاده می شود که نرخ استفاده ی منابع را افزایش می دهد. این مقاله الگوریتم زمان بندی ارائه می دهد که جریان های کاری همزمان را مدیریت می کند. منابع بطور همزمان استفاده می شوند و هر کاری دارای ددلاین و بودجه ی مخصوص خود است .
تحقیقات اخیر در تلاش برای استراتژی های پویا برای این جریان های کاری بود ولی فقط تعادل در تخصیص منابع و کاهش زمان اجرا را در نظر گرفته بود . الگوریتم زمان بندی آگاه از سود MQ-PAS که در اینجا ارائه شده است سود نهایی با در نظر گرفتن میزان بودجه را افزایش می دهد . ما قابلیت های الگوریتم را نشان می دهیم و با ساختار ها و جریان های کاری مختلف آنرا بررسی می کنیم. نتایج آزمایش ها نشان می دهد که استراتژی ما سوددهی ارائه دهنده را بطور چشمگیری افزیش می دهد و در مقایسه با کار های مشابه نرخ موفقیت بالاتری دارد.
|
مقاله ترجمه شده |
3 |
Marcher: A Heterogeneous System Supporting Energy-Aware High Performance Computing and Big Data Analytics
راه پیما: یک سیستم ناهمگن حمایتی انرژی آگاه محاسبات با کارایی بالا و تحلیل داده های بزرگ-2017 Excessive energy consumption is a major constraint in designing and deploying the next generation
of supercomputers. Minimizing energy consumption of high performance computing and big data
applications requires novel energy-conscious technologies (both hardware and software) at multiple
layers from architecture, system support, and applications. In the past decade, we have witnessed
the significant progress toward developing more energy-efficient hardware and facility infrastructure.
However, the energy efficiency of software has not been improved much. One obstacle that hinders the
exploration of green software technologies is the lack of tools and systems that can provide accurate,
fine-grained, and real-time power and energy measurement for technology evaluation and verification.
Marcher, a heterogeneous high performance computing infrastructure, is built to fill the gap by providing
support to research in energy-aware high performance computing and big data analytics. The Marcher
system is equipped with Intel Xeon CPUs, Intel Many Integrated Cores (Xeon Phi), Nvidia GPUs, power
aware memory systems and hybrid storage with Hard Disk Drives (HDDs) and Solid State Disks (SSDs). It
provides easy-to-use tools and interfaces for researchers to obtain decomposed and fine-grained power
consumption data of these primary computing components. This paper presents the design of the
Marcher system and demonstrates the usage of Marcher power measurement tools to obtain detailed
power consumption data in various research projects.
Keywords:Energy efficient high performance|computing|Energy-aware big data analytics|Power-measurable systems|Power profiling |
مقاله انگلیسی |
4 |
An MPI–CUDA library for image processing on HPC architectures
کتابخانه MPI-CUDA برای پردازش تصویر در معماری HPC-2015 Scientific image processing is a topic of interest for a broad scientific community since
it is a mean of gaining understanding and insight into the data for a growing number
of applications. Furthermore, the technological evolution permits large data acquisition,
with sophisticated instruments, and their elaboration through complex multidisciplinary
applications, resulting in datasets that are growing at an extremely rapid pace. This
results in the need of huge computational power for the processing. It is necessary
to move towards High Performance Computing (HPC) and to develop proper parallel
implementations of image processing algorithms/operations. Modern HPC resources are
typically highly heterogeneous systems, composed of multiple CPUs and accelerators such
as Graphics Processing Units (GPUs) and Field-Programmable Gate Arrays (FPGAs). The
actual barrier posed by heterogeneous HPC resources is the development and/or the
performance efficient porting of software on such complex architectures. In this context,
the aim of this work is to enable image processing on cluster of GPUs, through the use of
PIMA(GE)
2
Lib, the Parallel IMAGE processing GEnoa Library. The library is able to exploit
traditional clusters through MPI, GPU device through CUDA and a first experimentation
is aimed to explore the use of GPU-clusters. Library operations are provided to the users
through a sequential interface defined to hide the parallelism of the computation. The
parallel computation, at each level, is managed employing specific policies designed to
suitably coordinate the parallel processes/threads involved in the elaboration and their
use is tightly coupled with the PIMA(GE)
2
Lib interface. In this paper, we present the
incremental approach adopted in the development of the library and the performance gains
in each implementations: quite linear speedup is achieved on cluster architecture, about a
30% improvement in the execution time on a single GPU and the first results on cluster of
GPUs are promising.
Keywords: Image processing | Parallel computing | GPU |
مقاله انگلیسی |
5 |
پشتیبانی از سیستم عامل برای زمانبندی بارگذاری روی سیستم¬های ناهمگن مبتنی بر شتاب ده
سال انتشار: 2015 - تعداد صفحات فایل pdf انگلیسی: 15 - تعداد صفحات فایل doc فارسی: 30 استفاده از شتاب¬ده ها در حوزه وظایف پردازشی، اجرایی و محاسباتی ناهمگن، از طریق دامنه وسیعی از کاربردها، روز به روز در حال گسترش است. با ظهور معماری¬های محاسباتی متنوعی که در حال حاضر موجود هستند، نیاز به محیط چندکاره سیستم-واید در حال افزایش است.بنابراین، ما در اینجا یک زمانبند مبتنی بر Open CL ارائه می کنیم که از آن به عنوان یک محیط محاسباتی چند کاربره استفاده می¬شود تا ضمن اینکه به صورت یک دیمون(شبح) اجرا می¬شود، از پتانسیل کامل منابع موجود به صورت بهینه استفاده شود. وظایف چندگانه را می¬توان با استفاده از یک c++API که به یک پوشش OpenCL c++ بستگی دارد، صادر کرد. در این مرحله، دیمون بلافاصله کنترل را در دست گرفته وزمانبندی بارگذاری را اجرا می¬کند. به دلیل نحوه پیاده¬سازی رویکرد ما، می¬توان آن را به سهولت به یک سیستم عامل معمولی اعمال کرد. ما روش خود رااز طریق آزمایشات گسترده ¬ای که با اعمال مجموعه¬ای از کاربردها انجام می¬شود، تایید می¬کنیم که نشان می¬دهد هزینه¬های پایین زمانبندی، در دامنه وسیعی از اندازه ورودی، مجموعا به صورت ثابت باقی می-ماند. به علاوه، در این آزمایشها از CPU های مختلف، انواع GPU های مدرن و معماری¬های شتاب ده¬ دیگر استفاده می¬شود. |
مقاله ترجمه شده |
6 |
تحقیقی در زمینه معماری سیستم عامل ناهمگون چند هسته ای
سال انتشار: 2014 - تعداد صفحات فایل pdf انگلیسی: 4 - تعداد صفحات فایل doc فارسی: 11 با توجه به تحقیقات در زمینه چارچوب نرم افزار پردازنده چند هسته ای ، بر اساس چارچوب نرم افزار سلسله مراتبی که شامل سطح داده، سطح کنترل و سطح مدیریت میباشد ، در این مقاله یک معماری نرم افزاری برای سیستم عامل هتروژن پیشنهاد داده شده است. این سیستم عامل پیشنهادی، ملاحظاتی از مشکلات توسعهای موجود در سطح مدیریت، کلیت (عمومیت) سطح کنترل و بازدهی پردازش در سطح داده ای را در نظر میگیرد. ما معماری هتروژن چند هسته ای را به ترتیب از جنبه های سطح داده، مدل برنامه ریزی، تعامل سیگنال سیستم عامل هتروژن و تعامل داده ها ؛توضیح میدهیم. ازمایشها نشان میدهند که این معماری سیستم عامل هتروژن چند هسته ای، میتواند نسبت به معماری عمومی، عملکرد پردازش پروتکل شبکه را به صورت بهتری ارائه دهد.
کلمات کلیدی: معماری نرم افزار | پردازنده چند هسته ای | سیستم عامل | سیستم ناهمگن |
مقاله ترجمه شده |